インターネットにおける学術漢字の符号化に関する研究
网络学术汉字编码研究
基本信息
- 批准号:08207122
- 负责人:
- 金额:$ 1.47万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1996
- 资助国家:日本
- 起止时间:1996 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
1.今年度は、1966年発行朝日・毎日・読売朝夕刊の用語用字調査で1/60の面サンプリングの対象となつた切り抜き記事をイメージでデータベースに記録するプログラムを作成し、朝日新聞について入力作業を行った。本プログラムは、新聞切り抜き記事データをスキャナから読み込み、クライアント・サーバ環境においた2台のパーソナル・コンピュータで実行するシステムである。イメージ情報として新聞記事をデータベースとした目的は、新聞調査のデータ保存の他、漢字と文列データベースの原簿として理容師、校正漏れに対する補助手段とするために設けた。検索処理は、サーバにおいた新聞記事のイメージ・データをクライアンから直接または漢字データベースを介して検索を行う。指定できる検索キ-の種類は、新聞種類、発行月、日、紙面のページ、サンプリング・ブロック番号の5種である。また、画面に表された新聞切り抜き記事は、画面上で拡大、縮小、切り取り、ファイル出力を指定する機能を設けた。検索処理およびイメージの読み込みプログラムは、Visual BasicとVisual Cを使用した。また、データ葉、圧縮記録した。2.朝日新聞記事全文データベースに出現するすべてのゲタ文字「=」を大型汎用計算機で検索し、縮刷版と照らし合わせて実際の紙面での表記を同定した。それらの一覧表を作成したところ、ゲタ文字は、「真正」、「不正」、「隠れ」の3つのタイプに分類できることが明らかになった。不正ゲタ文字と隠れ文字をめぐって、その出現を招いた原因を推論した。3.「英日漢計算機詞彙」(中国科学院)の入力の継続およびファイルの修正を行った。また、上記のファイルに出現する漢字のうち、出現頻度の高い漢字について、一般語(主として小説の言語)における意味・用法を調べ、両者の比較を行った。
1. Our は, 1966 発 asahi, in their day, 読 売 daily publication の survey 1/60 で の surface using words and language サ ン プ リ ン グ の like と seaborne な つ た cut り sorting き chronicle を イ メ ー ジ で デ ー タ ベ ー ス に record す る プ ロ グ ラ ム を make し, asahi shimbun に つ い line homework を っ て in force た. This プ ロ グ ラ ム は cut, press り sorting き chronicle デ ー タ を ス キ ャ ナ か ら 読 み 込 み, ク ラ イ ア ン ト · サ ー バ environment に お い た two の パ ー ソ ナ ル · コ ン ピ ュ ー タ で line be す る シ ス テ ム で あ る. イ メ ー ジ intelligence と し て news chronicle を デ ー タ ベ ー ス と し た purpose は, investigative の デ ー タ save の he, Chinese characters と column デ ー タ ベ ー ス の original book と し て beauty-care division, correction leakage れ に す seaborne る incentives と す る た め に set け た. 検 cable 処 は, サ ー バ に お い た news chronicle の イ メ ー ジ · デ ー タ を ク ラ イ ア ン か ら directly ま た は characters デ ー タ ベ ー ス を interface し て 検 cable line を う. Specify で き る 検 suo キ - type の は, news type, line 発 month, day, paper の ペ ー ジ, サ ン プ リ ン グ · ブ ロ ッ ク mash の five で あ る. ま た, picture に table さ れ た news cut り sorting き で note は, picture company, big, narrow, cutting り り, フ ァ イ ル output を specified す る function set を け た. 検 cable 処 Richard お よ び イ メ ー ジ の 読 み 込 み プ ロ グ ラ ム は, Visual Basic と Visual C を use し た. Youdaoplaceholder0, デ タ タ leaf, compressed record た た. 2. Asahi shimbun chronicle full-text デ ー タ ベ ー ス に appear す る す べ て の ゲ タ text "=" を large domestic computer で 検 cable し brush, shrink version と according ら し close わ せ て be interstate の paper で の mark whatever を with fixed し た. A 覧 そ れ ら の table を made し た と こ ろ, ゲ タ text は, "real", "not", "the government れ" の 3 つ の タ イ プ に classification で き る こ と が Ming ら か に な っ た. The government not ゲ タ text と れ text を め ぐ っ て, そ の appear を recruit い た reason を inference し た. 3. "Computer Vocabulary in English, Japanese and Chinese" (Chinese Academy of Sciences) <s:1> input force <e:1> 継続およびファ 継続およびファ 継続およびファ を った correct を lines った. ま た, written の フ ァ イ ル に appear す る characters の う ち, Chinese characters appear high frequency の い に つ い て, general language (main と し て novel の words) に お け る means, usage を adjustable べ line, struck の is を っ た.
项目成果
期刊论文数量(28)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
横山詔一・野崎浩成: "「コーパスを利用した日本語環境の分析」" 日本行動計量学会第24回大会特別セッション. 138-139 (1996)
Shoichi Yokoyama 和 Hironari Nozaki:“使用语料库分析日语语言环境”特别会议,日本行为计量学会第 24 届年会 138-139 (1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
野崎浩成・横山詔一: "「新聞と雑誌における漢字使用頻度の分析-心理学での材料統制の観点から-」" 日本行動計量学会第24回大会. 266-267 (1996)
Hironari Nozaki 和 Shoichi Yokoyama:“报纸和杂志中汉字使用频率的分析 - 从心理学中的材料控制的角度”,日本行为计量学会第 24 届年会 266-267(1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
斎藤秀紀: "JISに無い字をどう扱うか-具体的事例報告" 人文学と情報処理. No.10. 22-25 (1996)
斋藤秀德:“如何处理 JIS 中未找到的字符 - 具体案例报告”人文与信息处理第 10. 22-25 号(1996 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
野崎浩成・横山詔一: "心理学のための漢字頻度基準表の作成(2)" 日本心理学会第60回大会. 600 (1996)
Hironari Nozaki 和 Shoichi Yokoyama:“创建心理学汉字频率标准表(2)”第 60 届日本心理学会年会 600(1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
野崎浩成・横山詔一ほか: "「漢字使用頻度の時代的変化に関する考察」" 計量国語学会第40回大会. 8 (1996)
Hironari Nozaki、Shoichi Yokoyama 等人:“‘关于汉字使用频率随时间变化的考虑’”第 40 届日本计量和语言学会会议 8 (1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
斎藤 秀紀其他文献
斎藤 秀紀的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('斎藤 秀紀', 18)}}的其他基金
インターネットにおける学術漢字の符号化に関する基礎的研究-日本語学習の支援を含めて-
互联网学术汉字编码的基础研究 - 包括对日语学习的支持 -
- 批准号:
10111110 - 财政年份:1998
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (A)
インターネットにおける学術漢字の符号化に関する基礎的研究
网络学术汉字编码基础研究
- 批准号:
09204115 - 财政年份:1997
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
インターネットにおける学術漢字の符号化に関する研究
网络学术汉字编码研究
- 批准号:
07207129 - 财政年份:1995
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
分散処理による大量日本語処理の効率化に関する研究
通过分布式处理提高大批量日语处理效率的研究
- 批准号:
56580034 - 财政年份:1981
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
言語解析を応用した日本語文修正処理の効率化に関する研究
利用语言分析提高日语句子校正处理效率的研究
- 批准号:
X00090----458022 - 财政年份:1979
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)