Machine-learning Approaches to Corpus Stylistics: Towards the Creation of International Collaborative Network

语料库文体学的机器学习方法:迈向国际协作网络的创建

基本信息

  • 批准号:
    18H00675
  • 负责人:
  • 金额:
    $ 10.07万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2018
  • 资助国家:
    日本
  • 起止时间:
    2018-04-01 至 2022-03-31
  • 项目状态:
    已结题

项目摘要

まず,参照コーパスを構成するテクストのマークアップを改善するために,プログラミング言語Pythonで,テクストの構造を手がかりに,自動的に文書構造マークアップを実施するスクリプトの開発に注力した。このスクリプトの開発の結果,段落の前後を<p></p>でマークアップするだけでなく,テクスト中の引用の前後に<quote></quote>を埋め込む一方,スマートクウォートを全てダムクウォートに変換,nダッシュ,mダッシュともに<dash;/>タグに変換するほか,称号や数字の表記も統一することにより,底本テクストによるパンクチュエイションのばらつきを可能な限り最小化することを支援できるようになった。これを基に,テクストマークアップの質を高めるために推敲を進めた。並行して,トピックモデリングを文体論研究に応用するために,自然言語処理分野の先行研究を幅広く渉猟し,知識基盤の整備に努めた。この段階までの研究成果について以下のような形で発表・報告することにより,リビューを受けている。(1) 日本英文学会中国四国支部第74回大会シンポジウム「デジタル時代の英語英米文学研究と英語教育」パネル発表「確率論的トピックモデリングによるBritish classic fictionの「遠読」」(2) Western Australia Universityで開催されたBuilding Digital Humanitiesでのパネルセッション"Digital Humanities as/and computational Science"にてDHにおける機械学習について講演した。(3) フランスおよびドイツへ出張し,最新の研究情報を収集するとともに,連携拠点形成についての意見交換を行なった。
ま ず, consult コ ー パ ス を constitute す る テ ク ス ト の マ ー ク ア ッ プ を improve す る た め に, プ ロ グ ラ ミ ン グ words Python で, テ ク ス ト の tectonic を hand が か り に, automatic に document structure マ ー ク ア ッ プ を be applied す る ス ク リ プ ト の open 発 に note force し た. こ の ス ク リ プ ト の open 発 の result, before and after paragraphs の を < p > < / p > で マ ー ク ア ッ プ す る だ け で な く, テ ク ス ト の in reference の に before and after the < quote > < / quote > を buried め 込 む, ス マ ー ト ク ウ ォ ー ト を full て ダ ム ク ウ ォ ー ト に variations in, n ダ ッ シ ュ, m ダ ッ シ ュ と も に < dash; / > タ グ に variations in す る ほ か, title や digital sign の submission も unified す る こ と に よ り, dibon テ ク ス ト に よ る パ ン ク チ ュ エ イ シ ョ ン の ば ら つ き を may な limits minimize り す る こ と を support で き る よ う に な っ た. こ れ を に, テ ク ス ト マ ー ク ア ッ プ の を high quality め る た め に scrutiny を into め た. Parallel し て, ト ピ ッ ク モ デ リ ン グ を stylistics research に 応 with す る た め に, natural speech 処 manage eset の first research を picture hiroo く involved 猟 し, gearing up knowledge base plate の に Mr め た. こ の Duan Jie ま で の research に つ い て following の よ う な form で す 発 table, report る こ と に よ り, リ ビ ュ ー を by け て い る. (1) the Japanese English institute China branch back to the 74 convention シ ン ポ ジ ウ ム "デ ジ タ ル era の English British m と literary study English education" パ ネ ル 発 table "theory of probabilistic ト ピ ッ ク モ デ リ ン グ に よ る British classic fiction の" far 読 "" (2) the Western Australia Universityで launches されたBuilding Digital Humanitiesで パネ パネ セッショ セッショ <e:1> "Digital Humanities as/and computational Science"にてDHにおける Machine learning にて て Lecture <s:1> た. (3) フ ラ ン ス お よ び ド イ ツ へ zhang し, latest research intelligence の を 収 set す る と と も に, even with 拠 point form に つ い て の exchange line を な っ た.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
「ズームイン・ズームアウト―デジタルヒューマニティーズとテクストの「読み」―」
《放大与缩小:数字人文与文本的“读”》
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;田畑 智司
  • 通讯作者:
    田畑 智司
Tracing Thematic Transition in Dickens’s Literature and Journalism
追踪狄更斯文学与新闻学的主题转变
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nagasaki;Kiyonori;田畑 智司;Saoko Funada;Tomoji Tabata;Tomoji Tabata
  • 通讯作者:
    Tomoji Tabata
確率論的トピックモデリングによるBritish classic fictionの「遠読」(シンポジウム「デジタル時代の英語英米文学研究と英語教育」)
使用概率主题模型对英国经典小说进行“远读”(研讨会“数字时代的英语文学研究与英语教育”)
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司
  • 通讯作者:
    田畑 智司
Stylometry and Classic British Fiction
文体测量学和英国经典小说
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;田畑 智司;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;田畑 智司;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;田畑 智司
  • 通讯作者:
    田畑 智司
Digital Humanities as Non-Linear Reading: Style in classic British fiction
数字人文作为非线性阅读:英国经典小说的风格
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nagasaki;Kiyonori;田畑 智司;Saoko Funada;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata
  • 通讯作者:
    Tomoji Tabata
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

田畑 智司其他文献

Topic modelling Dickens fiction
狄更斯小说的主题建模
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田畑 智司;田畑 智司;田畑 智司;田畑 智司;田畑 智司;田畑 智司;田畑 智司;田畑 智司;Tomoji Tabata
  • 通讯作者:
    Tomoji Tabata
-ly副詞の生起頻度解析による文体識別-コレスポンデンス分析と主成分分析による比較研究-『電子化言語資料分析研究』
-ly 通过副词频率分析识别写作风格 - 对应分析与主成分分析的比较研究 - 《电子语言材料分析研究》
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    齊藤 俊雄;中村 純作;赤野一郎;田畑 智司ほか;田畑 智司(編);田畑 智司(編);田畑 智司
  • 通讯作者:
    田畑 智司
「コーパス文体論の展開」
“语料库文体学的发展”
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tomoji;Tabata;田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;田畑 智司
  • 通讯作者:
    田畑 智司
「コロケーションと文体」
《搭配与写作风格》
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tomoji;Tabata;田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司
  • 通讯作者:
    田畑 智司
『電子化言語資料分析研究2005-2006』
《电子语言材料分析研究2005-2006》
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田畑 智司;他六名
  • 通讯作者:
    他六名

田畑 智司的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('田畑 智司', 18)}}的其他基金

コーパスに基づく近代英語散文の通史的文体研究
基于语料库的现代英语散文的历史文体研究
  • 批准号:
    14710333
  • 财政年份:
    2002
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
コンピュータコーパスを用いた18〜19世紀英語散文の文体研究
利用计算机语料库对18-19世纪英语散文进行文体研究
  • 批准号:
    12710254
  • 财政年份:
    2000
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
コーパス言語学的手法に基づくディケンズの文体研究のためのデータベース構築と応用
基于语料库语言学方法研究狄更斯风格的数据库构建及应用
  • 批准号:
    10710229
  • 财政年份:
    1998
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

レ枢機卿による「マザリナード」研究-テクストの社会性を対象とする学域横断研究-
莱斯红衣主教的《Mazarinade》研究——针对文本社会性的跨学科研究——
  • 批准号:
    22KJ2078
  • 财政年份:
    2023
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
テクスト構造に基づくマンガの文字と画像データの統合的利用のための基盤の開発
基于文本结构的漫画文本与图像数据综合利用平台开发
  • 批准号:
    23K18642
  • 财政年份:
    2023
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
英米文学作品と歴史文体論:顔身体表現へのデジタルヒューマニティーズ的アプローチ
英美文学作品和历史文体学:面部和身体表达的数字人文方法
  • 批准号:
    23K00600
  • 财政年份:
    2023
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
From generality to specialization: a new phase of the knowledge environment for Buddhist studies in the digital medium
从普遍到专门:数字媒体佛学知识环境的新阶段
  • 批准号:
    23H00002
  • 财政年份:
    2023
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
ルソー政治思想に関する生成的手稿研究:『社会契約論』と『道徳書簡』を中心に
卢梭政治思想生成手稿研究:以“社会契约”与“道德书信”为中心
  • 批准号:
    22K00106
  • 财政年份:
    2022
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
International Research on the Revival of Classical Texts in 18th- and 19th-Century Japan
18世纪和19世纪日本古典文本复兴的国际研究
  • 批准号:
    20KK0006
  • 财政年份:
    2020
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research (B))
文理横断のためのマンガの循環型データプラットフォームに関する研究
跨人文科学的漫画循环数据平台研究
  • 批准号:
    20K20129
  • 财政年份:
    2020
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Research on Extension of Qualitative Research Method by Using Interactive CG Technology
利用交互式CG技术扩展定性研究方法的研究
  • 批准号:
    20K12554
  • 财政年份:
    2020
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
The Development of Shakespeare Performance Studies and Education through Multimedia Edition
多媒体版莎士比亚表演研究与教育的发展
  • 批准号:
    19K00387
  • 财政年份:
    2019
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Inheritance and development of the digital knowledge base of Buddhist studies
佛学数字化知识库的传承与发展
  • 批准号:
    19H00516
  • 财政年份:
    2019
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了