Search engine using automatic web page ranking procedure and automatic classification
使用自动网页排名程序和自动分类的搜索引擎
基本信息
- 批准号:12558038
- 负责人:
- 金额:$ 3.58万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2001
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The amount of World Wide Web (WWW) pages has grown dramatically over the last few years with the growth of internet. It is estimated that there are currently over 3,200 million WWW pages. In order to satisfy the requirement for new search engines for WWW pages, it is necessary to develop automatic mechanisms for the deletion of less important pages, judgment of usefulness of pages, and subject classification for Web pages.The first year, the automatic judging procedure for page type was developed. Web page were typed manually to standard pages, top pages, contents pages, bulletin boards, chat pages, link pages, diary pages, and input forms. The automatic judgment method based on quantitative analysis of judged pages was developed. The algorithm of a type judgment was based on the frequency of appearance of HTML tags, page length or words in titles and file names obtained from Web pages in Japanese.In the second year, the total amount of a Web page was estimated, and automatic judgment system of useful Web pages and automatic classification system were developed. The algorithm of automatic judgment system is based on the morphological analysis of pages which obtained the high score by the judgment of "being good sources of information". In order to classify WWW pages in Japanese by subject, we present two classification algorithms based on relative frequencies of terms and information retrieval technique using vector-space model.These methods are included in the search engine and it participated in the 2nd NTCIR workshop Web task.
在过去的几年里,随着互联网的发展,万维网(WWW)页面的数量急剧增长。据估计,目前有超过32亿个WWW页面。为了满足新的WWW页面搜索引擎的需求,有必要开发网页的自动删除机制、网页有用性判断机制和网页主题分类机制。第一年,开发了页码的自动判断程序。网页被手动输入到标准页、首页、内容页、公告栏、聊天页、链接页、日记页和输入表单。提出了基于页数定量分析的自动判断方法。类型判断算法基于从日语网页中获取的HTML标签出现频率、页面长度或标题和文件名中的单词。第二年,对网页总量进行估算,开发了有用网页自动判断系统和自动分类系统。自动判断系统的算法是基于对被判定为“好信息源”而获得高分的页面进行形态分析。为了按主题对日语WWW页面进行分类,提出了两种基于词条相对频率的分类算法和基于向量空间模型的信息检索技术。这些方法被纳入搜索引擎,并参加了第二届NTCIR研讨会的Web任务。
项目成果
期刊论文数量(44)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
上田修一: "情報源としてのWWW"メディア・コミュニケーション. 51. 42-50 (2001)
Shuichi Ueda:“WWW 作为信息源”媒体传播。51. 42-50 (2001)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
上田修一他: "Webページ評価の視点と基準"三田図書館・情報学会研究大会発表論文集. 2000. 33-36 (2000)
Shuichi Ueda 等:“网页评估的观点和标准”三田图书馆和信息社会研究会议记录 2000。 33-36 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
安形 輝: "WWW調査におけるサンプル集合の収集法"三田図書館・情報学会研究大会発表論文集. 2000. 37-40 (2000)
Akira Agata:“WWW 调查中收集样本集的方法”三田图书馆和信息社会研究会议记录 2000 年。 37-40 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
AGATA, Teru, et al: "Sampling Mathods for WWW survey"Proceedings of MITA Society for Library and Information Science 2000. 37-40 (2000)
AGATA, Teru 等人:“WWW 调查的抽样方法”MITA 图书馆和信息科学学会会议记录 2000. 37-40 (2000)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
UEDA, Shuichi et al.: "Viewpoints for Evaluation of Web pages"Proceedings of MITA Society for Library and Information Science 2000. 33-36 (2000)
UEDA, Shuichi 等:“网页评估的观点”MITA 图书馆情报学会会议记录 2000. 33-36 (2000)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
UEDA Shuichi其他文献
話題空間の構成に基づくWeb探索履歴可視化手法の提案
一种基于主题空间结构的网络搜索历史可视化方法的提出
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
ISHITA Emi;UEDA Shuichi;他;枝隼也,島田諭,関洋平,神門典子,佐藤哲司 - 通讯作者:
枝隼也,島田諭,関洋平,神門典子,佐藤哲司
Three phases ofthe smallpox mortality in Japan in the19th century, pp.161-162 in Czech Geographical Society (ed.), Abstracts of XV.
19 世纪日本天花死亡率的三个阶段,捷克地理学会(编辑)第 161-162 页,第十五届摘要。
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
ISHITA Emi;UEDA Shuichi;他;枝隼也,島田諭,関洋平,神門典子,佐藤哲司;KAWAGUCHI Hiroshi - 通讯作者:
KAWAGUCHI Hiroshi
Global Structure of Directed Networks Emerging from a Category Theoretical Formulation of the Idea "Objects as Processes, Interactions as Interfaces"
从“对象作为过程,交互作为接口”这一思想的范畴理论表述中出现的有向网络的全局结构
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
ISHITA Emi;UEDA Shuichi;他;枝隼也,島田諭,関洋平,神門典子,佐藤哲司;KAWAGUCHI Hiroshi;T Haruna - 通讯作者:
T Haruna
UEDA Shuichi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('UEDA Shuichi', 18)}}的其他基金
study of library use pattern by Large quantitative data analysis
大数据定量分析图书馆利用模式研究
- 批准号:
15K00453 - 财政年份:2015
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
The Development of a Search Engine for Academic Papers in Web
网络学术论文搜索引擎的开发
- 批准号:
21300095 - 财政年份:2009
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
The Evidence-Based Approach in Library and Information Science
图书情报学的循证方法
- 批准号:
18300081 - 财政年份:2006
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Library and Information Professions and Education Renewal
图书馆和信息专业与教育更新
- 批准号:
15200017 - 财政年份:2003
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Role of neurotransmitters and environmental enrichment in the critical period of brain development
神经递质和环境丰富在大脑发育关键期的作用
- 批准号:
14580733 - 财政年份:2002
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
NEURODEGENERATION AND NEUROPROTECTION OF MESOSTRIATAL DOPAMINE SYSTEM
中纹状体多巴胺系统的神经变性和神经保护
- 批准号:
10680707 - 财政年份:1998
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Information Retrieval protocol Z39.50 Application for OPACs
信息检索协议 Z39.50 OPAC 应用
- 批准号:
09558040 - 财政年份:1997
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Transformation of Science Communication by the Information Technology and Networks
信息技术和网络对科学传播的变革
- 批准号:
09680403 - 财政年份:1997
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
NEURONAL CIRCUIT FORMATION IN THE GENETICAL AND EXPERIMENTAL BRAIN MALFORMATION ANIMAL.
遗传和实验脑畸形动物的神经回路形成。
- 批准号:
08680824 - 财政年份:1996
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Database Search Agent for Network Information Resources
网络信息资源数据库搜索代理
- 批准号:
07558167 - 财政年份:1995
- 资助金额:
$ 3.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
相似海外基金
Easy Digital to Search Engine Optimisation
轻松数字化搜索引擎优化
- 批准号:
10070414 - 财政年份:2023
- 资助金额:
$ 3.58万 - 项目类别:
Collaborative R&D
A k-mer-based search engine for sequencing databases
基于 k-mer 的测序数据库搜索引擎
- 批准号:
2138585 - 财政年份:2022
- 资助金额:
$ 3.58万 - 项目类别:
Continuing Grant
LEADS-Engine: Linguistically Enabled Analytic Dark Search Engine
LEADS-Engine:支持语言分析的暗搜索引擎
- 批准号:
10028033 - 财政年份:2022
- 资助金额:
$ 3.58万 - 项目类别:
Collaborative R&D
Defending our cyberspace: AI-powered search engine for cyber threat intelligence
保卫我们的网络空间:人工智能驱动的网络威胁情报搜索引擎
- 批准号:
561035-2020 - 财政年份:2022
- 资助金额:
$ 3.58万 - 项目类别:
Alliance Grants
Using Search Engine Data for Detection and Early Intervention in Suicide Prevention
使用搜索引擎数据进行自杀预防的检测和早期干预
- 批准号:
10401836 - 财政年份:2021
- 资助金额:
$ 3.58万 - 项目类别:
Using Search Engine Data for Detection and Early Intervention in Suicide Prevention
使用搜索引擎数据进行自杀预防的检测和早期干预
- 批准号:
10591819 - 财政年份:2021
- 资助金额:
$ 3.58万 - 项目类别:
Defending our cyberspace: AI-powered search engine for cyber threat intelligence
保卫我们的网络空间:人工智能驱动的网络威胁情报搜索引擎
- 批准号:
561035-2020 - 财政年份:2021
- 资助金额:
$ 3.58万 - 项目类别:
Alliance Grants
Using Search Engine Data for Detection and Early Intervention in Suicide Prevention
使用搜索引擎数据进行自杀预防的检测和早期干预
- 批准号:
10207109 - 财政年份:2021
- 资助金额:
$ 3.58万 - 项目类别:
Using Search Engine Data for Detection and Early Intervention in Suicide Prevention
使用搜索引擎数据进行自杀预防的检测和早期干预
- 批准号:
10616794 - 财政年份:2021
- 资助金额:
$ 3.58万 - 项目类别:
Grocery Visual Search Engine
杂货视觉搜索引擎
- 批准号:
65856 - 财政年份:2020
- 资助金额:
$ 3.58万 - 项目类别:
Responsive Strategy and Planning














{{item.name}}会员




