コンピュータコーパスを用いた18〜19世紀英語散文の文体研究
利用计算机语料库对18-19世纪英语散文进行文体研究
基本信息
- 批准号:12710254
- 负责人:
- 金额:$ 1.47万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2001
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究は18〜19世紀の英語散文大規模コーパスを構築し,いわゆる「散文の世紀」と呼ばれる時代からvictoria時代にかけての英語散文の文体的特徴を通時的視座および共時的視座の両面から記述しようという試みである。計二年目の平成13年度は,前半では,平成12年度に引き続き言語データの電子化法の理論的検討と実験を相補的な形でとりおこなうことによって研究基盤の確立をはかり,後半では,出来上がった電子コーパスの統計学的解析を通して,英語散文文体における口語化の傾向や言語使用域における文体変異の相を分析した。研究成果の主な点は次の通りである:1.語彙品詞標識マークアップ(組み込み)法の理論的検討および実践。最近のコーパス言語学の成果,とりわけマークアップに関する研究を比較検討し,文体研究に最適化した形でマークアップを応用する方法を研究した。電子テキストを元に,様々なタイプのテキストマークアップの試行とテキスト分析の実験を繰り返し,英語散文のテキスト処理に有用なマークアップ方法の開発を試みた。その結果,品詞標識に関してはPenn-Treebank方式に準じた形式を採用し,自動品詞標識付与プログラム(UNIXサーバ上で稼働)に学習させることで,自動認識率を96%以上にまで高めることが可能になった。本研究計画で作成したコーパスはいずれもPenn-Treebank準拠の品詞標識が埋め込まれている。なお,この成果の一部については,研究代表者が編集した論文集『電子化言語資料分析の方法論』(大阪大学言語文化部・大阪大学大学院言語文化研究科発行)所収の「英語文体論研究のための言語処理技術-Corpus Processing for Stylistic Analysis of Texts」に発表した。2.コーパスデータの文体統計学的分析。編纂したコーパスから得られたデータを基に,さまざまな語彙項目や構文間の相互関係,テキスト間の相互関係,そして語彙や構文とテキストとの相互関係を分析し,Dickensの散文を軸にその前後の時代,すなわち,18世紀および19世紀後半の散文との文体比較を行った。その結果、18〜19世紀の英語散文における言語特徴の出現パターンは,経年的に変化しているということ,特に,19世紀初頭の散文において典型的に認められるより文語的,形式的,複雑な構造を持ったものから,19世紀後半の散文に特徴的な相対的に口語的,並列的,文脈依存な傾向を深めた文体へと移り変わっていることを本研究は明らかにした。なお、この成果の一部はオランダ・Rodopi社より本年3月発刊のEnglish Corpus Linguistics in Japanの第16章1nvestigating Stylistic Variation in Dickens through Correspondence Analysis of Word-Class Distribution,および渡辺秀樹(編)『英語文体論の方法と射程』(大阪大学言語文化部・大阪大学大学院言語文化研究科発行)の第4章「コーパス言語学の文体論:Corpus-Based Stylistics-MF/MD法による文体比較」にて発表した。
This study describes the stylistic features of English prose in the 18th and 19th centuries. In 2002, the first half of 2003, the second half of 2004, the first half of 2005, the second half of 2006, the third half of 2007, the third half of 2007, the fourth half of 2008, the The main points of the research are as follows:1. The theoretical discussion and practice of the word identification method Recent achievements in linguistics, comparative studies, stylistic studies, and optimization methods The development of the method of electronic prose processing is a trial of the method of electronic prose processing. As a result, the automatic recognition rate of product identification is higher than 96%, and the automatic recognition rate is higher than 96%. This research project was designed to identify Penn-Treebank criteria. "Corpus Processing for Stylistic Analysis of Texts," a collection of papers compiled by a research representative,"Methodology for Electronic Speech Data Analysis," published by Osaka University Graduate School of Speech and Culture, Osaka University. 2. Stylistic statistical analysis of. This paper analyzes the interrelations between words and structures, and compares Dickens 'prose styles from the 18th century to the second half of the 19th century. English prose from the 18th to the 19th century features of speech from the beginning of the 19th century to the end of the 19th century features of prose from the second half of the 19th century to the end of the 19th century features of speech from the second half of the 19th century features from the second half of Context dependence tends to be profound and stylistic. Chapter 16 of English Corpus Linguistics in Japan, published in March 2009, is presented in Chapter 4 of English Corpus Linguistics in Japan:Corpus-Based Stylistics-MF/MD Method, edited by Hideki Watanabe, Department of Language and Culture, Osaka University.
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Tomoji Tabata(共著): "English Corpus Linguistics in Japan"Editions Rodopi. 340 (2002)
Tomoji Tabata(合著者):《日本英语语料库语言学》Editions Rodopi 340 (2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
田畑 智司: "第4章コーパス言語学の文体論:Corpus-Based Stylistics-MF/MD法による文体比較-"渡辺秀樹(編)英語文体論の方法と射程(大阪大学言語文化部・大阪大学大学院言語文化研究科発行). 75-89 (2002)
Satoshi Tabata:“第 4 章语料库语言学的文体学:使用基于语料库的文体学-MF/MD 方法的文体学比较” Hideki Watanabe(编辑)英语文体学的方法和范围(大阪大学语言文化学院研究生院)大阪大学)语言文化研究生院出版)75-89(2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
田畑 智司(編): 電子化言語資料分析の方法論(大阪大学言語文化部・大阪大学大学院言語文化研究科発行). 40 (2002)
Satoshi Tabata(编辑):分析数字化语言材料的方法(大阪大学语言文化学院/大阪大学语言文化研究生院出版)40(2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
田畑 智司: "英語文体論研究のための言語処理技術-Corpus Processing for Stylistic Analysis of Texts"田畑 智司(編)電子化言語資料分析の方法論(大阪大学言語文化部・大阪大学大学院言語文化研究科発行). 25-39 (2002)
Satoshi Tabata:《文本文体分析的语言处理技术》Satoshi Tabata(主编)《数字化语言材料分析方法》(大阪大学语言文化学院/大阪大学语言文化研究生院出版)25-39。 (2002)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
田畑 智司其他文献
Topic modelling Dickens fiction
狄更斯小说的主题建模
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
田畑 智司;田畑 智司;田畑 智司;田畑 智司;田畑 智司;田畑 智司;田畑 智司;田畑 智司;Tomoji Tabata - 通讯作者:
Tomoji Tabata
-ly副詞の生起頻度解析による文体識別-コレスポンデンス分析と主成分分析による比較研究-『電子化言語資料分析研究』
-ly 通过副词频率分析识别写作风格 - 对应分析与主成分分析的比较研究 - 《电子语言材料分析研究》
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
齊藤 俊雄;中村 純作;赤野一郎;田畑 智司ほか;田畑 智司(編);田畑 智司(編);田畑 智司 - 通讯作者:
田畑 智司
「コーパス文体論の展開」
“语料库文体学的发展”
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Tomoji;Tabata;田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;田畑 智司 - 通讯作者:
田畑 智司
「コロケーションと文体」
《搭配与写作风格》
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Tomoji;Tabata;田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司 - 通讯作者:
田畑 智司
田畑 智司的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('田畑 智司', 18)}}的其他基金
Machine-learning Approaches to Corpus Stylistics: Towards the Creation of International Collaborative Network
语料库文体学的机器学习方法:迈向国际协作网络的创建
- 批准号:
18H00675 - 财政年份:2018
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
コーパスに基づく近代英語散文の通史的文体研究
基于语料库的现代英语散文的历史文体研究
- 批准号:
14710333 - 财政年份:2002
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
コーパス言語学的手法に基づくディケンズの文体研究のためのデータベース構築と応用
基于语料库语言学方法研究狄更斯风格的数据库构建及应用
- 批准号:
10710229 - 财政年份:1998
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似国自然基金
城市群文体公共设施资源配置优化研究
- 批准号:71874120
- 批准年份:2018
- 资助金额:50.0 万元
- 项目类别:面上项目
相似海外基金
「侍り」を端緒とした平安私家集詞書の文体研究
从《武士》开始的平安私人收藏风格研究
- 批准号:
24K15974 - 财政年份:2024
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
修辞機能分析を用いた相関調査による文体的特徴の研究
通过修辞功能分析的相关调查研究文体特征
- 批准号:
23K00569 - 财政年份:2023
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
明治期における聖書翻訳と日本語文体意識に関する研究
明治时期圣经翻译与日本文体意识研究
- 批准号:
23K00546 - 财政年份:2023
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
英米文学作品と歴史文体論:顔身体表現へのデジタルヒューマニティーズ的アプローチ
英美文学作品和历史文体学:面部和身体表达的数字人文方法
- 批准号:
23K00600 - 财政年份:2023
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
イギリス児童文学黎明期の女性作家の形容詞と文体:コーパス文体論からのアプローチ
英国儿童文学早期女性作家的形容词和写作风格:语料库文体学的方法
- 批准号:
23K00596 - 财政年份:2023
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
中世語・近世語におけるコロケーションの文体差および位相差に関する研究
中世纪和近代早期语言搭配的文体差异和相位差异研究
- 批准号:
23K00564 - 财政年份:2023
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
英国小説における知覚描写の質的・量的文体研究
英国小说感性描写的定性和定量文体研究
- 批准号:
23K12199 - 财政年份:2023
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Dupatyの旅行記の文体論的分析:前ロマン主義の旅行記における詩性の解明
杜帕蒂游记的文体分析:揭示前浪漫主义游记的诗意本质
- 批准号:
22K00471 - 财政年份:2022
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Victorian Controversialists: Literary Form and the Rhetoric of Confrontation, 1830-1888
维多利亚时代的争议主义者:文学形式和对抗修辞,1830-1888
- 批准号:
2739926 - 财政年份:2022
- 资助金额:
$ 1.47万 - 项目类别:
Studentship