Efficient Text Big Data Mining Technology via Structure Extraction

基于结构提取的高效文本大数据挖掘技术

基本信息

  • 批准号:
    19H01133
  • 负责人:
  • 金额:
    $ 28.37万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
  • 财政年份:
    2019
  • 资助国家:
    日本
  • 起止时间:
    2019-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

テキスト情報と時系列情報の両面からマイクロブログなど時系列情報が加味されたテキストデータをクラスタリングし、その特徴を捉える手法を開発した。マイクロブログのようなデータは、時系列情報が加味されているが、同一のトピックに所属することと、類似するタイムスタンプを持つことが等価でないために、時系列情報を効果的に用いてトピック分類を行うことが困難であった。今回、テキスト情報からマイクロクラスタを構築することで、単一のトピックに属し、かつ時系列の分布を持つ単位にデータをまとめ上げることに成功し、その時系列分布情報を使うことで、表面的な言葉使いは異なるが意味的に同一のトピックに対応するマイクロクラスタをまとめ上げる技術の開発に成功した。これは、時系列情報をマイクロクラスタを使うことで、形質化することに成功しており、本プロジェクトの基本コンセプトに合致する成果となっている。また、この他にも、グラフ分析、テキスト分析、時系列データ分析などに有効な複数のマイニング型グラフアルゴリズムを開発し、同じく乱数生成などの基礎アルゴリズムの開発も行った。また、テキストデータの解析手法を現実の問題、とくに人文科学系のモチベーションを持つ問題へと適用し、解析結果を得ている。
テ キ ス ト intelligence と series intelligence の when struck surface か ら マ イ ク ロ ブ ロ グ な ど series intelligence when が flavored さ れ た テ キ ス ト デ ー タ を ク ラ ス タ リ ン グ し, そ の, 徴 を catch え る gimmick を open 発 し た. マ イ ク ロ ブ ロ グ の よ う な デ ー タ は, when series intelligence が flavored さ れ て い る が, same の ト ピ ッ ク に belongs す る こ と と, similar す る タ イ ム ス タ ン プ を hold つ こ と が etc 価 で な い た め に, when series intelligence を unseen fruit に with い て ト ピ ッ ク classification line を う こ と が difficult で あ っ た. Today, back テ キ ス ト intelligence か ら マ イ ク ロ ク ラ ス タ を build す る こ と で, 単 の ト ピ ッ ク に し and か つ series の distribution when を hold つ 単 a に デ ー タ を ま と め on げ る こ と に successful し, そ の series distributed intelligence を make う こ と で, な words on the surface of the leaf makes い は different な る が mean に the same の ト ピ ッ ク に 応 seaborne す る マ イ ク ロ ク The げる technology on ラスタをまとめ has been successfully developed に た. こ れ は, when series intelligence を マ イ ク ロ ク ラ ス タ を make う こ と で, qualitative す る こ と に successful し て お り, this プ ロ ジ ェ ク ト の basic コ ン セ プ ト に close to す る results と な っ て い る. ま た, こ の he に も, グ ラ フ analysis, テ キ ス ト analysis, time series デ ー タ analysis な ど に have sharper な plural の マ イ ニ ン グ type グ ラ フ ア ル ゴ リ ズ ム を open 発 し, with じ く random number generation な ど の based ア ル ゴ リ ズ ム の open 発 も line っ た. ま た, テ キ ス ト デ ー タ の parsing technique を now be の problem, と く に humanistic sciences の モ チ ベ ー シ ョ ン を つ problem へ と し, analytical results て を い る.

项目成果

期刊论文数量(52)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Adaptive integrate-and-fire model reproduces the dynamics of olfactory receptor neuron responses in a moth
  • DOI:
    10.1098/rsif.2019.0246
  • 发表时间:
    2019-08
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Marie Levakova;Lubomir Kostal;C. Monsempès;P. Lucas;R. Kobayashi
  • 通讯作者:
    Marie Levakova;Lubomir Kostal;C. Monsempès;P. Lucas;R. Kobayashi
データ研磨アルゴリズムの挙動と収束性の解析
数据抛光算法的行为和收敛性分析
クラスタリング安定化手法を用いた芯クラスタの抽出と実データによる質の評価
使用聚类稳定方法提取核心簇并使用真实数据评估质量
Prediction of Crime Occurrence using Information Propagation Model and Gaussian Process
使用信息传播模型和高斯过程预测犯罪发生
  • DOI:
    10.1109/asiajcis.2019.000-2
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shusuke Morimoto;Hajime Kawamukai;Kilho Shin
  • 通讯作者:
    Kilho Shin
Neural Networks Weights Quantization: Target None-retraining Ternary (TNT)
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

宇野 毅明其他文献

アルゴリズムな世界(第2回)計算量を減らせ : アルゴリズムの真価は,計算量を劇的に減らすことにある,Newton = ニュートン : graphic science magazine 41(9) 120-123(分担執筆)
算法世界(第二部分)减少计算量:算法的真正价值在于大幅减少计算量,牛顿:图形科学杂志 41(9) 120-123(投稿人)
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    宇野 毅明
  • 通讯作者:
    宇野 毅明
「蝗」をめぐる日中比較文化的考察―「虫供養」や「駆蝗」の観点から
中日“蝗虫”文化比较思考:以“昆虫祭祀”与“灭蝗”为视角
データ研磨によるバイクラスタマイニング
通过数据抛光进行双簇挖掘
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    宇野 毅明;小池 敦;中原 孝信;羽室 行信
  • 通讯作者:
    羽室 行信
物理的インタフェイスを用いた経路制御学習教材の開発に関する研究
利用物理接口的路径控制学习资料开发研究
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    宇野 毅明;武富 有香;小林 亮太;橋本 隆子;久保山 哲二;申 吉浩;今津麻衣・氏間和仁・田中武志;吉原和明,石川有彩,渡辺健次
  • 通讯作者:
    吉原和明,石川有彩,渡辺健次
具体的事故事例分析を通じた自動運転車の交通事故に関する刑事責任の研究①
通过具体事故案例分析自动驾驶汽车交通事故刑事责任研究①
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    宇野 毅明;中原 孝信;羽室;行信;中川由賀
  • 通讯作者:
    中川由賀

宇野 毅明的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('宇野 毅明', 18)}}的其他基金

実践的な列挙アルゴリズムの理論構築
实用枚举算法的理论构建
  • 批准号:
    16092227
  • 财政年份:
    2004
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
列挙アルゴリズムの遅延時間減少とその手法の一般化
减少枚举算法的延迟时间并推广该方法
  • 批准号:
    15700022
  • 财政年份:
    2003
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
列挙アルゴリズムの高速化手法の一般化とその適用
枚举算法加速方法的推广及其应用
  • 批准号:
    13780207
  • 财政年份:
    2001
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

情報源符号の平均符号長と復号遅延に関する階層的クラスタリングの解明
关于信息源代码的平均代码长度和解码延迟的层次聚类的阐明
  • 批准号:
    24K14818
  • 财政年份:
    2024
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
高次元小標本におけるクラスタリング手法とカーネル法の有効性に関する理論と応用
高维小样本中聚类方法和核方法有效性的理论与应用
  • 批准号:
    24K20748
  • 财政年份:
    2024
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
銀河クラスタリングと重力レンズ効果を用いた標準宇宙論モデルの検証
使用星系团聚和引力透镜验证标准宇宙学模型
  • 批准号:
    24KJ0211
  • 财政年份:
    2024
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
尺度混在・次元縮約クラスタリングによる主要情報の抽出と効率的計算環境の開発
使用混合尺度/降维聚类提取关键信息并开发高效计算环境
  • 批准号:
    24K14869
  • 财政年份:
    2024
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自然炎症マーカーを用いたHFpEF患者の病態クラスタリングと薬物治療選択への応用
使用天然炎症标志物对 HFpEF 患者进行病理聚类及其在药物治疗选择中的应用
  • 批准号:
    24K18329
  • 财政年份:
    2024
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
有害事象分散表現のクラスタリングによる医薬品安全シグナル検出手法の開発
利用不良事件分布式表示聚类开发药物安全信号检测方法
  • 批准号:
    24K15817
  • 财政年份:
    2024
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
不確実性を考慮したクラスタリングに基づく柔軟な推薦システムに関する発展的研究
考虑不确定性的基于聚类的柔性推荐系统发展研究
  • 批准号:
    24K15110
  • 财政年份:
    2024
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Hierarchical structure of knowledge networks and hierarchical analogical reasoning
知识网络的层次结构与层次类比推理
  • 批准号:
    23K18497
  • 财政年份:
    2023
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
MS/MSスペクトルの階層的クラスタリングによる農薬代謝物の網羅的探索
通过 MS/MS 谱图的层次聚类全面搜索农药代谢物
  • 批准号:
    23K05086
  • 财政年份:
    2023
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Study on liquid water content fluctuation in high Reynolds number turbulence with large-scale mixing in convective clouds
对流云大尺度混合高雷诺数湍流中液态水含量波动研究
  • 批准号:
    23K03686
  • 财政年份:
    2023
  • 资助金额:
    $ 28.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了