国会会議録コーパスと地方議会会議録コーパスを横断した言語的分析

对议会会议记录语料库和地方议会会议记录语料库进行语言分析

基本信息

  • 批准号:
    20K00576
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

2022年度には統一地方選挙を単位として構築している都道府県議会会議録2019ー2023期サブセットの速報版を作成し,議員別の発言特徴語の基礎的な分析を行った。今後,確定版を構築し,詳細な分析を行う予定である。また,大規模コーパスからの言語的特徴の抽出の新しい試みとして,機械学習とXAI(説明可能な人工知能)技術を用いた分類手法を2022年6月の人工知能学会全国大会において提案した。提案手法を用いて地方議会会議録コーパスから方言的特徴を抽出する探索的方言調査手法の研究を進め,日本方言研究会の機関誌『方言の研究』に論文を投稿し採録された(2023年7月発刊予定)。この研究ではまず,入力文の発言地(都道府県)を自動推定する分類器を機械学習によって構築する。次に,XAI技術を用い,発言文のどの部分を手がかりに分類器が自動推定を行ったかを可視化する。可視化結果を分析し,発言地推定の手がかりとして方言がどの程度使用されているのかを考察する。発言地推定の手がかりの大半が地名や施設名,施策名であったものの,「はぐって」「特にも」「してみえる」等の方言を分類器が学習し,自動推定の手がかりとしていることが明らかになった。また,定型表現の地域差を見つけたり,方言を多用する話者を探すことにも役立つことが示唆された。AIを用いた大規模言語資源からの探索的方言研究の可能性を示した。現在,国会会議録と地方議会会議録の言語的特徴の比較に対しても同様の手法を適用し,研究を深化させているところである。
2022 に は unified place chooses 挙 を 単 a と し て build し て い る tao house 県 council meeting record 2019 ー 2023 サ ブ セ ッ ト の fast newspaper edition を し consummate, lawmakers don't の 発 speech, 徴 language の base line な analysis を っ た. In the future, the definitive version を constructs を, and the detailed な analysis を line う is determined to である. ま た, large-scale コ ー パ ス か ら の words of 徴 の drew new し の い try み と し て, rote learning と XAI を (instructions may な artificial can know) technology with い た classification technique を の artificial knowledge can learn in June 2022 national convention に お い て proposal し た. Proposed technique を with い て council meeting record コ ー パ ス か ら dialect of 徴 を spare す る explore dialect survey technique を の research into め, Japan dialect research の machine masato volunteers contribute "dialect の research" を に paper し transcribing さ れ た (発 publication in July 2023 to decide). <s:1> を research on で, まず, まず, and construction of を automatic presumption する classifier を machine learning によって by rurimin 県 (prefecture 県) する. に, XAI technology を い, 発 said wen の ど の part を hand が か り に classifier が automatically presumed line を っ た か を visualization す る. Visualization analysis results を し, 発 presumption to の hand が か り と し て dialect が ど の degree using さ れ て い る の か を investigation す る. 発 presumption to の hand が か り の most が places や facilities, ShiCe name で あ っ た も の の, "は ぐ っ て" "に も" "し て み え る" を classifier が learning し の dialect, such as automatic presumption の hand が か り と し て い る こ と が Ming ら か に な っ た. ま た, finalize the design performance の regional difference を see つ け た り, dialect を multi-purpose す る words を agent す こ と に も servants made つ こ と が in stopping さ れ た. The possibility of dialect research <s:1> explored by AIを using the large-scale speech resources of た ら を indicates that を た た. Now, the congress meeting record と council meeting record の words of 徴 の is に し seaborne て も with others の を applicable し, deepening research を さ せ て い る と こ ろ で あ る.

项目成果

期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
地方議会会議録コーパスプロジェクト
地方议会会议记录语料库项目
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
NTCIR15 QA Lab-PoliInfo-2の報告およびデータセット公開
NTCIR15 QA Lab-PoliInfo-2 报告和数据集发布
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木村泰知;渋木英潔;高丸圭一;内田ゆず;乙武北斗;石下円香;三田村照子;吉岡真治;秋葉友良;小川泰弘;佐々木稔;横手健一;神門典子;森辰則;荒木健治;関根聡
  • 通讯作者:
    関根聡
妊娠・出産・育児に関する情報サイトにおける母親の検索行動の予備的分析
母亲对孕产育儿相关信息网站搜索行为的初步分析
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    内田ゆず;高丸圭一;乙武北斗;木村泰知
  • 通讯作者:
    木村泰知
都道府県議会会議録コーパスの拡張―2011期と2015期の比較―
县议会会议记录资料库的扩充 - 2011年和2015年的比较 -
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    内田ゆず;高丸圭一;乙武北斗;木村泰知
  • 通讯作者:
    木村泰知
構造化データ作成を目的としたPDF地方議会資料のテキスト抽出に関する分析
分析从 PDF 本地装配材料中提取文本以创建结构化数据
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    乙武 北斗;内田 ゆず;高丸 圭一;木村 泰知
  • 通讯作者:
    木村 泰知
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

高丸 圭一其他文献

『初期英国演劇資料集』(Records of Early English Drama)を読む――特権劇団としての宮内大臣一座・国王一座
读《英国早期戏剧实录》——皇家张伯伦剧团和国王剧团作为特权剧团
進化計算を用いた人間の感性理解のための遺伝子解析法
利用进化计算理解人类情感的遗传分析方法
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    乙武 北斗;高丸 圭一;内田 ゆず;木村 泰知;野村 俊太 荒井 幸代
  • 通讯作者:
    野村 俊太 荒井 幸代
判例フォーカス 行政法
案例法焦点 行政法
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木村 泰知;本田 正美;河村 和徳;高丸 圭一;内田 ゆず;乙武 北斗;吐合 大祐;遠藤 勇哉;河村耕平;村上 裕章=下井 康史編
  • 通讯作者:
    村上 裕章=下井 康史編
公的場面における婉曲表現―議会会議録の「~ふうに+思考動詞」を例に―
公共场合的委婉语:以议会会议纪要中的“~funi + 思考动词”为例。
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    乙武 北斗;高丸 圭一;内田 ゆず;木村 泰知;山際彰
  • 通讯作者:
    山際彰
経済学史(MINERVAスタートアップ経済学 3)
经济学史(MINERVA 创业经济学 3)
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木村 泰知;本田 正美;河村 和徳;高丸 圭一;内田 ゆず;乙武 北斗;吐合 大祐;遠藤 勇哉;清水崇;藏本龍介;定兼仁;小峯敦
  • 通讯作者:
    小峯敦

高丸 圭一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了