検索の難しさの形式化と予測型検索方式に関する研究
搜索难度形式化及预测搜索方法研究
基本信息
- 批准号:18650057
- 负责人:
- 金额:$ 1.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2006
- 资助国家:日本
- 起止时间:2006 至 2008
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
日本語をはじめとするいくつかの東アジア言語の特徴の一つに複合語が頻出することが挙げられ、キーワードによる情報検索の精度を劣化させる原因の一つとなっている。また、自然言語文においては二語以上からなる言い回しがしばしば含まれ、自然言語文による情報検索を難しくする要因の一つとなっている。さらに、日本語に限らず一般に、情報検索の難しさの要因として、同義語や多義語の存在が挙げられる。これらの問題意識のもと、最終年度である平成20年度は、前年度までに検討してきた、(1)語間依存性と関連性を考慮した検索クエリ構築手法、および、(2)自然言語文における語間依存性を考慮した検索クエリ構築手法について、評価および成果の取りまとめを実施した。それぞれについて以下に概要を示す。1.入力クエリを構成する個々の複合語における構成語間の依存関係、並びに、複合語間の依存関係に着目した二段階語間依存性モデルを開発した。これはマルコフ確率場モデルに基づき、入力クエリの構成語の隣接関係を利用して構造化クエリを自動生成する。さらに、二段階語間依存性モデルと適合モデルを組み合わせる方式について検討した。適合モデルは情報検索のための確率的言語モデルの枠組みによってクエリ拡張を実現する技法である。2.自然言語文に対してチャンク(かたまり)同定を行い、チャンク内の語間依存性と、チャンク間の依存性に着目したクエリ構造化手法を設計した。これは上述の二段階語間依存性モデルを、自然言語文クエリを想定して拡張したものであり、係り受け解析の結果を活用して、着目する依存関係を限定することで、計効果的な構造化クエリ生成を実現するものである。以上の提案手法について、JPドメインのウェブデータを利用して、有効性評価を行った。
Japanese Japaneseがげられ、キーワードによるIntelligence 検Soの AccuracyをDeteriorationさせるcauseの一つとなっている.また、Natural language textにおいては Language 2 or aboveれ、Natural language textによるIntelligence 検SO しくするcautionの一つとなっている.さらに, Japanese にlimited らずGeneral に, Information 検SO no difficulty しさのessential reason として, synonyms やpolysemy のexistent がげられる.これらのISSUE Awareness のもと, the final year であるHeisei 20は, the previous year までに検说してきた, (1) interlingual dependency and correlation を CONSIDERATION した検SO クエリstruct Architectural techniques, および, (2) Natural language text におけるConsideration of inter-language dependenciesした検The method of construction of the original is について.それぞれについてThe following summary is shown. 1. Enter the クエリを constitute a 々の compound language における constitute the inter-language dependence relationship, and びに, the compound language inter-dependence relationship に出目 した inter-language dependence モデルを开発した. The これはマルコフ accuracy field モデルににづき and the entry force クエリの constituted language のadjacent relationship を are automatically generated using して structured クエリを. The dependency between さらに and the second stage モデルと is suitable for the モデルを group み合わせる method について検検した. Suitable for the accuracy of the information of the モデルは検SO no のためのモデルの枠组みによってクエリ拡张を実现するtechniques である. 2. Natural language text に対してチャンク(かたまり) is the same as を行い and チャンク内の语The interdependence and interdependence between interdependence and the interdependence between interdependence and the design of interdependence and structuralization techniques.これはThe above-mentioned two-stage inter-linguistic dependence モデルを, the natural language text クエリをscenario して拡张したものであり, the system Received Analysis のThe result is a structured structure that utilizes the character, focuses on the dependency relationship, and creates an effect based on the structure of the character. The above proposal method is used, JP ドメインのウェブデータを is used, and the effectiveness evaluation is done.
项目成果
期刊论文数量(21)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Multi-Entity-Topic Models with Who-entities and Where-entities
具有 Who 实体和Where 实体的多实体主题模型
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Hitohiro Shiozaki;Koji Eguchi;Takenao Ohkawa
- 通讯作者:Takenao Ohkawa
Entity Ranking from Annotated Text Collections using Multitype Topic Models
使用多类型主题模型对带注释的文本集合进行实体排名
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:Hitohiro Shiozaki;Koji Eguchi
- 通讯作者:Koji Eguchi
情報コンテンツからの社会ネットワーク構造の抽出と活用
从信息内容中提取和利用社交网络结构
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:Masakazu KATSU;Tetsuo Ideguchi;Takashi Okuda;Xuejun Tan;戈木クレイグヒル滋子;倉本到;江口浩二
- 通讯作者:江口浩二
Opinion Retrieval Experiments using Generative Models: Experiments for the TREC 2007 Blog Track
使用生成模型的意见检索实验:TREC 2007 博客轨道的实验
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Yuki Arai;Koji Eguchi
- 通讯作者:Koji Eguchi
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
江口 浩二其他文献
Information hiding inside 3-D printed objects by forming high reflectance projections
通过形成高反射率投影将信息隐藏在 3D 打印物体内部
- DOI:
10.1145/3177404.3177455 - 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
西出 飛翔;江口 浩二;Masahiro Suzuki,Tomohisa Matumoto,Youichi Takashima,Hideyuki Torii,Kazutake Uehira - 通讯作者:
Masahiro Suzuki,Tomohisa Matumoto,Youichi Takashima,Hideyuki Torii,Kazutake Uehira
仮想計算機を用いたサーバ統合環境におけるリソース浪費DoS攻撃の検出と遮断
使用虚拟机检测和阻止服务器集成环境中浪费资源的 DoS 攻击
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
新井 勇輝;江口 浩二;Koji Eguchi;Satoshi MATSUURA;石橋賢一;落合秀也;洞井 晋一;MATSUURA Satoshi;嶋津裕己;岡本慶大 - 通讯作者:
岡本慶大
江口 浩二的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('江口 浩二', 18)}}的其他基金
Learning explanable embeddings for topics and its applications
学习主题及其应用的可解释嵌入
- 批准号:
23K11231 - 财政年份:2023
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
情報爆発時代の風評被害対策のための情報検索・追跡に関する研究
信息爆炸时代防范声誉受损的信息搜索与追踪研究
- 批准号:
19024055 - 财政年份:2007
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
Web情報管理を目的とした情報検索とWebマイニングに関する研究
以Web信息管理为目的的信息检索与Web挖掘研究
- 批准号:
14780339 - 财政年份:2002
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
情報検索支援を目的としたユーザ適応型クラスタリング法に関する研究
信息检索支持的用户自适应聚类方法研究
- 批准号:
12780322 - 财政年份:2000
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)