コーパス言語学的手法に基づくディケンズの文体研究のためのデータベース構築と応用
基于语料库语言学方法研究狄更斯风格的数据库构建及应用
基本信息
- 批准号:10710229
- 负责人:
- 金额:$ 1.28万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1998
- 资助国家:日本
- 起止时间:1998 至 1999
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究計画はDickensの小説全作品を電子コーパス化し、語彙や構文の出現パターンをコンピュータ解析することによって、Dickensの英語を計量的な視点から記述しようという試みである。計画二年目の平成11年度は、前半では、平成10年度に引き続き言語データの電子化法の理論的検討と実験を相補的な形でとりおこなうことによって研究基盤の確立をはかり、後半では、出来上がった電子コーパスを基に文体統計論的分析を行うことでDickensの英語におけるおける語彙の生起パターンと文体変異の相互関係を考察した。研究実績の主な点は次の通り:1.語彙品詞標識マークアップ(組み込み)法の理論的検討および実践。最近のコーパス言語学の成果、とりわけマークアップに関する研究を比較検討し、文体研究に最適化した形でマークアップを応用する方法を研究した。電子テキストを元に、様々なタイプのテキストマークアップの試行とテキスト分析の実験を繰り返し、英語散文のテキスト処理に有用なマークアップ方法の開発を試みた。その結果、品詞標識に関してはPenn-Treebank方式に準じた形式を採用し、自動品詞標識付与プログラム(UNIXサーバ上で稼動)に学習させることで、自動認識率を96%以上にまで高めることが可能になった。本研究計画で作成したコーパスはいずれもPenn-Treebank準拠の品詞標識が埋め込まれている。2.コーパスデータの文体統計学的分析。編纂したコーパスから得られたデータを基に、さまざまな語彙項目や構文間の相互関係、テキスト間の相互関係、そして語彙や構文とテキストとの相互関係を分析した。その結果、Dickensの小説の言語における語彙の出現パターンは、i)経年的に変化しているということ、ii)言語使用域ごとに一貫したパターンが見受けられるということ、iii)作品の冒頭部における変異が最も大きく、作品の巻・章が進行するにつれて、変異が小さくなると言う傾向が見られた。これらのうち最も興味深い現象としてi)の経年変化を挙げることができる。Dickensの文体は前期の作品において典型的に認められるより文語的、形式的、複雑な構造を持ったものから、後期の作品に特徴的な相対的に口語的、並列的、文脈依存な傾向を深めた文体へと移り変わっていることを本研究は明らかにした。
This research plan is to make Dickens 'novels electronic, to analyze the appearance of words and structures, and to measure Dickens' English from the viewpoint of description. In the second year of the plan, the first half of the year and the tenth year of the year will introduce the theory of electronic speech analysis and complement each other. The establishment of the research base will be investigated. The second half of the year will come out. The analysis of stylistic statistics will be carried out. The origin of Dickens 'English words will be investigated. The main points of the research are as follows:1. The theoretical discussion and practice of the word identification method Recent achievements in linguistics, comparative studies, stylistic studies, and methods of optimization The development of the method of electronic text analysis and English text processing The result, the word identification, the Penn-Treebank method, the accurate form, the automatic word identification, the assignment and the learning (UNIX server), the automatic recognition rate, the 96% or more, the high probability, the low probability, the high probability, the high probability, the low probability, the high probability, the high probability, the low probability, the high probability, the low probability, the high probability, the high probability, the low probability, the high probability, the high probability, the probability, This research project was designed to identify Penn-Treebank criteria. 2. Stylistic statistical analysis of. To analyze the relationship between words and structures, and the relationship between words and structures As a result, Dickens 'novels have words that appear in different ways, i) in different ways, ii) in different ways, iii) in different ways, i) in different ways, iii) in different ways. The most interesting phenomenon is the phenomenon of the age change. Dickens 'style is different from that of his previous works in that it is typical of literary language, form, complex structure, and characteristics of his later works in that it is oral, juxtaposed, and context dependent.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
田畑 智司其他文献
Topic modelling Dickens fiction
狄更斯小说的主题建模
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
田畑 智司;田畑 智司;田畑 智司;田畑 智司;田畑 智司;田畑 智司;田畑 智司;田畑 智司;Tomoji Tabata - 通讯作者:
Tomoji Tabata
-ly副詞の生起頻度解析による文体識別-コレスポンデンス分析と主成分分析による比較研究-『電子化言語資料分析研究』
-ly 通过副词频率分析识别写作风格 - 对应分析与主成分分析的比较研究 - 《电子语言材料分析研究》
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
齊藤 俊雄;中村 純作;赤野一郎;田畑 智司ほか;田畑 智司(編);田畑 智司(編);田畑 智司 - 通讯作者:
田畑 智司
「コーパス文体論の展開」
“语料库文体学的发展”
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Tomoji;Tabata;田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;田畑 智司 - 通讯作者:
田畑 智司
「コロケーションと文体」
《搭配与写作风格》
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Tomoji;Tabata;田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司 - 通讯作者:
田畑 智司
田畑 智司的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('田畑 智司', 18)}}的其他基金
Machine-learning Approaches to Corpus Stylistics: Towards the Creation of International Collaborative Network
语料库文体学的机器学习方法:迈向国际协作网络的创建
- 批准号:
18H00675 - 财政年份:2018
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
コーパスに基づく近代英語散文の通史的文体研究
基于语料库的现代英语散文的历史文体研究
- 批准号:
14710333 - 财政年份:2002
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
コンピュータコーパスを用いた18〜19世紀英語散文の文体研究
利用计算机语料库对18-19世纪英语散文进行文体研究
- 批准号:
12710254 - 财政年份:2000
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
イギリス児童文学黎明期の女性作家の形容詞と文体:コーパス文体論からのアプローチ
英国儿童文学早期女性作家的形容词和写作风格:语料库文体学的方法
- 批准号:
23K00596 - 财政年份:2023
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
中世語・近世語におけるコロケーションの文体差および位相差に関する研究
中世纪和近代早期语言搭配的文体差异和相位差异研究
- 批准号:
23K00564 - 财政年份:2023
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
レトリックの構文体系の実証的研究:比喩表現の構造と機能
修辞句法系统的实证研究:比喻表达的结构与功能
- 批准号:
20K13016 - 财政年份:2020
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
文体分析を目的としたコーパスの文書情報拡張及びその利用
扩展语料库文档信息及其在文体分析中的用途
- 批准号:
18K00634 - 财政年份:2018
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
文芸研究に対する計量文体論の手法を用いた定量的研究
使用定量文体方法进行文学研究的定量研究
- 批准号:
18J10947 - 财政年份:2018
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for JSPS Fellows
歴史的コーパスを利用した社会言語学的文体論研究
使用历史语料库进行社会语言学文体研究
- 批准号:
18652046 - 财政年份:2006
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Exploratory Research
コーパスに基づく話し言葉文体論の構築
基于语料库的口语文体构建
- 批准号:
16652031 - 财政年份:2004
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Exploratory Research
コーパスに基づく近代英語散文の通史的文体研究
基于语料库的现代英语散文的历史文体研究
- 批准号:
14710333 - 财政年份:2002
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Young Scientists (B)