Search engine using automatic web page ranking procedure and automatic classification
使用自动网页排名程序和自动分类的搜索引擎
基本信息
- 批准号:12558038
- 负责人:
- 金额:$ 3.58万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2001
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The amount of World Wide Web (WWW) pages has grown dramatically over the last few years with the growth of internet. It is estimated that there are currently over 3,200 million WWW pages. In order to satisfy the requirement for new search engines for WWW pages, it is necessary to develop automatic mechanisms for the deletion of less important pages, judgment of usefulness of pages, and subject classification for Web pages.The first year, the automatic judging procedure for page type was developed. Web page were typed manually to standard pages, top pages, contents pages, bulletin boards, chat pages, link pages, diary pages, and input forms. The automatic judgment method based on quantitative analysis of judged pages was developed. The algorithm of a type judgment was based on the frequency of appearance of HTML tags, page length or words in titles and file names obtained from Web pages in Japanese.In the second year, the total amount of a Web page was estimated, and automatic judgment system of useful Web pages and automatic classification system were developed. The algorithm of automatic judgment system is based on the morphological analysis of pages which obtained the high score by the judgment of "being good sources of information". In order to classify WWW pages in Japanese by subject, we present two classification algorithms based on relative frequencies of terms and information retrieval technique using vector-space model.These methods are included in the search engine and it participated in the 2nd NTCIR workshop Web task.
随着互联网的增长,在过去的几年中,万维网(www)页面的数量显着增长。据估计,目前有超过32亿个www页面。为了满足对www页面新搜索引擎的要求,有必要开发自动机制以删除较少重要的页面,页面的判断以及网页的主题分类。第一年,开发了页面类型的自动判断程序。将网页手动输入到标准页面,顶部页面,内容页,公告板,聊天页,链接页面,日记页和输入表格中。开发了基于判断页面的定量分析的自动判断方法。类型判断的算法是基于HTML标签的外观频率,页面长度或单词中的标题和文件名中的单词和文件名,从日语中获得的网页获得。在第二年,估算了网页的总量,并开发了有用的网页和自动分类系统的自动判断系统。自动判断系统的算法基于对页面的形态分析,该页面通过“成为良好信息来源”的判断获得了高分。为了根据受试者对日语进行www页面进行分类,我们根据使用矢量空间模型的术语和信息检索技术的相对频率提出了两种分类算法。这些方法包括在搜索引擎中,并参与了第二个NTCIR研讨会Web任务。
项目成果
期刊论文数量(44)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
上田修一: "情報源としてのWWW"メディア・コミュニケーション. 51. 42-50 (2001)
Shuichi Ueda:“WWW 作为信息源”媒体传播。51. 42-50 (2001)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
上田修一他: "Webページ評価の視点と基準"三田図書館・情報学会研究大会発表論文集. 2000. 33-36 (2000)
Shuichi Ueda 等:“网页评估的观点和标准”三田图书馆和信息社会研究会议记录 2000。 33-36 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
安形 輝: "WWW調査におけるサンプル集合の収集法"三田図書館・情報学会研究大会発表論文集. 2000. 37-40 (2000)
Akira Agata:“WWW 调查中收集样本集的方法”三田图书馆和信息社会研究会议记录 2000 年。 37-40 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
AGATA, Teru, et al: "Sampling Mathods for WWW survey"Proceedings of MITA Society for Library and Information Science 2000. 37-40 (2000)
AGATA, Teru 等人:“WWW 调查的抽样方法”MITA 图书馆和信息科学学会会议记录 2000. 37-40 (2000)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
UEDA, Shuichi et al.: "Viewpoints for Evaluation of Web pages"Proceedings of MITA Society for Library and Information Science 2000. 33-36 (2000)
UEDA, Shuichi 等:“网页评估的观点”MITA 图书馆情报学会会议记录 2000. 33-36 (2000)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
UEDA Shuichi其他文献
話題空間の構成に基づくWeb探索履歴可視化手法の提案
一种基于主题空间结构的网络搜索历史可视化方法的提出
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
ISHITA Emi;UEDA Shuichi;他;枝隼也,島田諭,関洋平,神門典子,佐藤哲司 - 通讯作者:
枝隼也,島田諭,関洋平,神門典子,佐藤哲司
Three phases ofthe smallpox mortality in Japan in the19th century, pp.161-162 in Czech Geographical Society (ed.), Abstracts of XV.
19 世纪日本天花死亡率的三个阶段,捷克地理学会(编辑)第 161-162 页,第十五届摘要。
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
ISHITA Emi;UEDA Shuichi;他;枝隼也,島田諭,関洋平,神門典子,佐藤哲司;KAWAGUCHI Hiroshi - 通讯作者:
KAWAGUCHI Hiroshi
Global Structure of Directed Networks Emerging from a Category Theoretical Formulation of the Idea "Objects as Processes, Interactions as Interfaces"
从“对象作为过程,交互作为接口”这一思想的范畴理论表述中出现的有向网络的全局结构
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
ISHITA Emi;UEDA Shuichi;他;枝隼也,島田諭,関洋平,神門典子,佐藤哲司;KAWAGUCHI Hiroshi;T Haruna - 通讯作者:
T Haruna
UEDA Shuichi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('UEDA Shuichi', 18)}}的其他基金
study of library use pattern by Large quantitative data analysis
大数据定量分析图书馆利用模式研究
- 批准号:
15K00453 - 财政年份:2015
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
The Development of a Search Engine for Academic Papers in Web
网络学术论文搜索引擎的开发
- 批准号:
21300095 - 财政年份:2009
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
The Evidence-Based Approach in Library and Information Science
图书情报学的循证方法
- 批准号:
18300081 - 财政年份:2006
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Library and Information Professions and Education Renewal
图书馆和信息专业与教育更新
- 批准号:
15200017 - 财政年份:2003
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Role of neurotransmitters and environmental enrichment in the critical period of brain development
神经递质和环境丰富在大脑发育关键期的作用
- 批准号:
14580733 - 财政年份:2002
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
NEURODEGENERATION AND NEUROPROTECTION OF MESOSTRIATAL DOPAMINE SYSTEM
中纹状体多巴胺系统的神经变性和神经保护
- 批准号:
10680707 - 财政年份:1998
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Information Retrieval protocol Z39.50 Application for OPACs
信息检索协议 Z39.50 OPAC 应用
- 批准号:
09558040 - 财政年份:1997
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Transformation of Science Communication by the Information Technology and Networks
信息技术和网络对科学传播的变革
- 批准号:
09680403 - 财政年份:1997
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
NEURONAL CIRCUIT FORMATION IN THE GENETICAL AND EXPERIMENTAL BRAIN MALFORMATION ANIMAL.
遗传和实验脑畸形动物的神经回路形成。
- 批准号:
08680824 - 财政年份:1996
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Database Search Agent for Network Information Resources
网络信息资源数据库搜索代理
- 批准号:
07558167 - 财政年份:1995
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
相似国自然基金
搜索引擎中竞价排名广告披露方式与用户反应的实证研究
- 批准号:
- 批准年份:2020
- 资助金额:48 万元
- 项目类别:面上项目
面向3D XPoint的搜索引擎索引和缓存技术研究
- 批准号:61872201
- 批准年份:2018
- 资助金额:63.0 万元
- 项目类别:面上项目
基于GPU-CPU混合并行计算的微生物组大数据索引与搜索方法学研究
- 批准号:31771463
- 批准年份:2017
- 资助金额:55.0 万元
- 项目类别:面上项目
地震预警系统中搜索引擎方法的优化研究
- 批准号:41704040
- 批准年份:2017
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
整体蛋白质鉴定中的高效算法研究及其软件开发
- 批准号:31670837
- 批准年份:2016
- 资助金额:60.0 万元
- 项目类别:面上项目
相似海外基金
Michigan Institute for Clinical and Health Research (MICHR)
密歇根临床与健康研究所 (MICHR)
- 批准号:
10621051 - 财政年份:2023
- 资助金额:
$ 3.58万 - 项目类别:
Mechanism-Driven Virtual Adverse Outcome Pathway Modeling for Hepatotoxicity
机制驱动的肝毒性虚拟不良结果途径建模
- 批准号:
10940417 - 财政年份:2023
- 资助金额:
$ 3.58万 - 项目类别:
Easy Digital to Search Engine Optimisation
轻松数字化搜索引擎优化
- 批准号:
10070414 - 财政年份:2023
- 资助金额:
$ 3.58万 - 项目类别:
Collaborative R&D
Constructing a large-scale biomedical knowledge graph using all PubMed abstracts and PMC full-text articles and its applications
利用所有PubMed摘要和PMC全文文章构建大规模生物医学知识图谱及其应用
- 批准号:
10648553 - 财政年份:2023
- 资助金额:
$ 3.58万 - 项目类别:
Applied Curriculum in Gender and Equity Skills (ACES)
性别与平等技能应用课程(ACES)
- 批准号:
10731498 - 财政年份:2023
- 资助金额:
$ 3.58万 - 项目类别: