文体研究に関連する統計手法の確立のための基礎的研究
建立文体研究相关统计方法的基础研究
基本信息
- 批准号:07207223
- 负责人:
- 金额:$ 1.09万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1995
- 资助国家:日本
- 起止时间:1995 至 1996
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
近年、文学や哲学の研究にコンピュータを利用した文体統計学が注目されている。これは、個人の文体の相違を識別する多種類の言語パラメーターを使って、量的に言葉の使用を研究する新しい方法で、テキストの真偽問題や年代決定の解明に成果を上げている。本研究では研究例の豊富なシェイクスピアを取り上げ、それらの研究を系統的に分析し、先行する欧米での様々な統計手法の解明と基礎理論の有効性を調査した。1)欧米で最も権威ある学会である、ALLC (Association for Literary and Linguistic Computing)とACH (Association for Computers in the Humanities)の雑誌に発表された主要なシェイクスピア研究の論文を洗い出し、書誌データベースとシソ-ラスを作成した。又最新のニューロ・コンピュータを利用した論文については全文データベースを作成し、機械翻訳ソフトを利用して邦文データベースを作成した。2)作成されたデータベースを基に、今では“古典的"と称されるA. Q.モートンの語彙や特定の単語の位置を中心にした研究から、M.W.A.スミスが注目した頻度の高い単語の利用、さらにT.メイアムに代表されるニューロコンピュータを使った最新の研究までの展開を系統的に整理した。初期の研究では、コンピュータは過去の理論の跡付けに利用され、長年蓄積された様々な指標をパラメーター化することに力点が置かれた。その意味では仮説検証型の研究であった。しかし次第にコンピュータの機能や言語理論の発展に伴い、無意識に使われる高頻度の指標が開拓されるようになった。だが昨今は、高度なコンピュータ技術の発展の影響で、新しい手法で何ができるか、といった技術先行型の研究が増えてきた。中でもニューロコンピュータによるパターン認識の手法を使った文体研究が流行している。しかし、この方法は、データセット内に生ずるノイズも多く、神経のネットワークのトレーニングも必要となる。その為、文化系の研究者だけでは、実際の技術や理論の修得に困難を伴うため、手法がブラックボックス化される恐れがある。又望ましい成果を上げるために、出力されたデータに合わせて入力を操作することも可能なため、コンピュータを使うメリットと共に、弊害も目だつようになっている。文学者の質的なアプローチと統計学者の量的なテクニックの間の橋渡しをするような学際的な研究環境の整備が急務となろう。まお今回はデータの整備に時間がかかり成果の公表には至らなかった。文化系研究者に使い易いソフトの開発を含め今後の課題としたい。
In recent years, literary や and philosophical <e:1> studies have focused on にコ ピュ ピュ ピュ タを タを, and the utilization of <s:1> and た stylistic statistics has drawn attention to されて and る る. こ れ は, personal style の の を deemed to identify す る variety の words パ ラ メ ー タ ー を make っ て, amount of leaf の に words using を research す る new し で い method, テ キ ス ト の authenticity problem や s decision の interpret を に results げ て い る. This study で は research example の aboundant な シ ェ イ ク ス ピ ア を take り げ, そ れ ら の research を し に analysis, first す る omega で の others 々 な statistical technique の interpret と basic theory の have sharper sex を survey し た. 1) Omie で most で 権 wei ある society である, ALLC (Association for Literary and Linguistic Computing)とACH (Association for Computers in the Humanities) の 雑 tzu に 発 table さ れ た main な シ ェ イ ク ス ピ の ア research papers を wash い し, shuzhi デ ー タ ベ ー ス と シ ソ - ラ ス を made し た. And latest の ニ ュ ー ロ · コ ン ピ ュ ー タ を using し た paper に つ い て は full-text デ ー タ ベ ー ス を made し, mechanical double 訳 ソ フ ト を using し て bang wen デ ー タ ベ ー ス を made し た. 2) It is made as されたデ タベ タベ スを スを based on に, and the "classical "と today is called されるA. Q. モ ー ト ン の vocabulary や specific の の position を 単 language center に し た research か ら, M.W.A. ス ミ ス が attention し た high frequency の い の 単 language using, さ ら に t. メ イ ア ム に representative さ れ る ニ ュ ー ロ コ ン ピ ュ ー タ を make っ た の latest research ま で の expand に を's systems し た. Early の research で は, コ ン ピ ュ ー タ は past の theory の mark pay け に using さ れ, perennial accumulation さ れ た others 々 な index を パ ラ メ ー タ ー change す る こ と に lidian が buy か れ た. Youdaoplaceholder0 そ means that で 仮 仮 仮 says that 検 syndrome type <e:1> studies であった. し か し initial に コ ン ピ ュ ー タ の function theory や words の 発 exhibition に い, unconscious に make わ れ る high frequency の index が pioneering さ れ る よ う に な っ た. だ が yesterday today は, highly な コ ン ピ ュ ー タ technology の 発 exhibition の influence で, new し い gimmick で what が で き る か, と い っ た technology leading の が raised え て き た. In で も ニ ュ ー ロ コ ン ピ ュ ー タ に よ る パ タ ー ン know の gimmick を make っ た stylistic study が popular し て い る. し か し, こ の way は, デ ー タ セ ッ ト に born within ず る ノ イ ズ も く, god 経 の ネ ッ ト ワ ー ク の ト レ ー ニ ン グ も necessary と な る. そ の だ for researchers, culture is の け で は, be interstate の や theory の mend に difficult を with う た め, gimmick が ブ ラ ッ ク ボ ッ ク ス change さ れ る fear れ が あ る. Then at ま し を い results げ る た め に, output さ れ た デ ー タ に close わ せ て を operation into force す る こ と も may な た め, コ ン ピ ュ ー タ を make う メ リ ッ ト と に, canker も mesh だ つ よ う に な っ て い る. Literature is の qualitative な ア プ ロ ー チ と statist の quantity な テ ク ニ ッ ク の の bridge crossing between し を す る よ う な learn international な research environment gearing up の が because と な ろ う. Youdaoplaceholder0 this time, まお デ デ タ タ <s:1> preparation に time が まお <s:1> results <s:1> public table に に to らな った った. Researchers in the department of culture に make it easy for に ソフト に to develop を including め for future <s:1> research topics と た た と.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
長瀬 真理其他文献
長瀬 真理的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('長瀬 真理', 18)}}的其他基金
TOPIC MAP手法の文化資源情報への適用と有効利用のための基礎的研究
TOPIC MAP方法应用于文化资源信息及其有效利用的基础研究
- 批准号:
14019045 - 财政年份:2002
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
TOPIC MAP手法の文化資源情報への適用と有効利用のための基礎的研究
TOPIC MAP方法应用于文化资源信息及其有效利用的基础研究
- 批准号:
13224046 - 财政年份:2001
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (C)
文化資源情報におけるTopic Mapの適用と評価
主题图在文化资源信息中的应用与评价
- 批准号:
13680480 - 财政年份:2001
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
言語統計学によるプラント研究(コンピューターによる文体及び概念の意味論的考察)
使用语言统计进行植物研究(使用计算机对写作风格和概念进行语义考虑)
- 批准号:
X00210----571003 - 财政年份:1980
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
言語統計学によるプラトン研究(コンピューター使用による概念の意味論的考察)
使用语言统计进行柏拉图研究(使用计算机对概念进行语义考虑)
- 批准号:
X002102---401003 - 财政年份:1979
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)