日本語コーパスを応用した文章の難易測定の研究

利用日语语料库测量句子难度的研究

基本信息

  • 批准号:
    19011003
  • 负责人:
  • 金额:
    $ 1.86万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2007
  • 资助国家:
    日本
  • 起止时间:
    2007 至 2008
  • 项目状态:
    已结题

项目摘要

目的 : 本研究は大量の日本語コーパスを使って,日本語の文章の読み易さ・読み難さ(リーダビリティー)を数値で表す尺度(スケール)を構築することを目的とする。実施状況 : 日本語の様々な読み物を電子ファイル化し,様々な分析に使えるコーパスを作った。そのために10数名の研究補助者を雇い入れ,(1) 小学1年から高校3年までの国語教科書51冊,(2) 日本語能力試験1&2級読解問題(2002年から2006年の5年分), (3) ベストセラーのケータイ小説2作品, (4) 出版部数の多い雑誌(文芸春秋, ESSE, MORE,WITHを各3か月分)をページごとにスキャンし, OCRを使い, コンピュータで使えるよう電子ファイルにした。(1)から(4)までのテキストのほか, すでにCD-Romとなっている「新潮文庫の100冊」「毎日新聞データ集2006年度版」を使い, 形態素解析を行なった。当初,解析にはChaSenを使っていたが, より精度を高めるため, MeCabとIPA辞書に切り替え, ツールの整備を行なった。国語教科書をデータベースとして構築された学年判定式(小学1年から中学3年まで)を用いて, 様々な読み物を測定したところ, 最近人気のあるケータイ小説は小学6年から中学1年レベル, 「星の王子さま」は翻訳者によって, 小学2年から5年レベルにあることがわかった。本研究の意義 : 文章の難易を示す尺度が出来たことにより, 様々な文書のレベルを測定できる。例えば, 製品マニュアル, 薬の能書き, 災害マニュアルなどはわかりやすい文章で書かれるべきであるが, そのような文書を作成するための指標ができた。
Objective: This study aims to construct a set of numerical criteria for Japanese articles. The implementation of the situation: Japanese language and material, electronic and cultural, analysis and so on 10 research grants were hired,(1) 51 Mandarin textbooks for 1 year of elementary school and 3 years of college,(2) Japanese Language Proficiency Test Level 1 & 2 problem solving (5 years from 2002 to 2006), (3) 2 works of fiction, (4) Number of publications (Wenyun Chunqiu, ESSE, MORE,WITH 3 months each) (1)"100 volumes of the New Trend Library,""Daily News Collection 2006 Edition,""Morphological Analysis." At the beginning, the analysis of ChaSen is very accurate, and MeCab IPA dictionary is very accurate. Chinese textbooks are used to construct a formula for determining the academic year (primary school year 1 to secondary school year 3). The most recent person in the world is a novel from primary school year 6 to secondary school year 1, and the star prince is used to determine the academic year from primary school year 2 to secondary school year 5. The significance of this study: the difficulty of the article to show the scale of the article to come out, the document to determine the scope of the article. For example, the product is not available, and the disaster is not available.

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
文章の読み易さ評価システム及び文章の読み易さ評価方法
文本可读性评价系统及文本可读性评价方法
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
日本語の文章の難易はどのように測定できるか
如何衡量日语句子的难度?
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Tsumuraya;I. Fujii;and M. Hirama;Y.Yamazaki;柴崎秀子
  • 通讯作者:
    柴崎秀子
リーダビリティー・リサーチ・ラボ
可读性研究实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
文章中の漢字と漢語の分析による日本語リーダビリティー公式構築のための基礎研究
通过分析句子中的汉字和汉语单词构建日语可读性公式的基础研究
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Y. Ishihara;N. Lee;N. Oshiro;S. Matsuoka;S. Yamashita;M. Inoue;and M. Hirama;柴崎秀子・沢井康孝
  • 通讯作者:
    柴崎秀子・沢井康孝
「日本語コーパスを応用した文章の難易測定の研究
《利用日语语料库测量句子难度的研究》
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平間正博;山下修治;柴崎秀子・玉岡賀津雄・山本和英・原信一郎・加納満
  • 通讯作者:
    柴崎秀子・玉岡賀津雄・山本和英・原信一郎・加納満
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

柴崎 秀子其他文献

柴崎 秀子的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('柴崎 秀子', 18)}}的其他基金

英語母語話者と中国語母語話者における和製英語の知識と意味推測に関する調査
英语母语者和汉语母语者日语英语知识及语义推理调查
  • 批准号:
    18652051
  • 财政年份:
    2006
  • 资助金额:
    $ 1.86万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了