ウェブからの日仏対訳語彙、異形、句抽出システムの研究開発とその多言語への拡張

网络日法双语词汇、变体、短语提取系统的研发及其多语言扩展

基本信息

  • 批准号:
    04F04038
  • 负责人:
  • 金额:
    $ 0.77万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2004
  • 资助国家:
    日本
  • 起止时间:
    2004 至 无数据
  • 项目状态:
    已结题

项目摘要

次の3点について研究を行なった。1 非対訳・類似テーマコーパスからの語彙抽出手法として、日本語の単語とフランス語の単語とで対訳となりうる候補を、それらの単語が出現する文脈の近さを測定することにより抽出する手法をインプリメントした。標準的な文脈ベクタを用いた手法では、日本語とフランス語の注目語に対して、その出現文脈から単語(文脈語)を取り出し、辞書を用いて日仏の文脈語の同一性を認定した上で、その文脈ベクタを用いた注目語の近さを測定する。本研究では、この際の重み付けを改善したことに加え、言語的な知識を用いたフィルタリングを行い、抽出の精度を高めることに成功した。しかしながら、相変わらず、低頻度要素に対する訳語対抽出については、課題が残る。これについては、日英では文字列類似度により、低頻度要素に多いカタカナ語をカバーできるが、フランス語との対応でこれらが利用可能かどうかについては、今後の課題としたい。2 日本語とフランス語のそれぞれにつき、専門語を構成する複合語のパターンを、品詞および日本語では語種を用いて定義し、各言語についての抽出精度を評価した。TMREC用語抽出テストベッドでは、統計的重み付けを用いないパターン抽出で、既存のシステムよりよいパフォーマンスを出すことがわかった。これは、日本語では一見したところ複合語の単位は簡単に定義できそうであるが、実際にはきめ細かい定義が極めて重要であることを示すものである。3 日仏の対訳専門用語抽出パターンを定義・評価するために、日仏科学技術用語のデータを作成した。
The next 3 points に に に て て て study the を line なった. 1 the polices 訳, similar テ ー マ コ ー パ ス か ら の vocabulary extraction technique と し て, Japanese の 単 language と フ ラ ン ス language の 単 language と で 訳 seaborne と な り う る backup を and そ れ ら の 単 language appear が す る context の nearly さ を determination す る こ と に よ り spare す る gimmick を イ ン プ リ メ ン ト し た. Standard な context ベ ク タ を with い た gimmick で は, Japanese と フ ラ ン ス language の attention language に し seaborne て, そ の appear context か ら 単 language (context) を り し, dictionaries を with い て day 仏 の context language の identity を cognizance し た で, そ の context ベ ク タ を with い た attention language の nearly さ を determination す る. This study で は, こ の interstate の heavy み pay け を improve し た こ と に え, speech な knowledge を with い た フ ィ ル タ リ ン グ を い, take high precision の を め る こ と に successful し た. <s:1> する訳 ながら, phase change わらず, low-frequency element に to する訳 language pair extract に が て て て, subject が residual る. こ れ に つ い て は, day Britain で は text columns similar degrees に よ り, low frequency elements に い カ タ カ ナ language を カ バ ー で き る が, フ ラ ン ス language と の 応 seaborne で こ れ ら が may use か ど う か に つ い て は, future の subject と し た い. 2 Japanese と フ ラ ン ス language の そ れ ぞ れ に つ き, 専 door を constitute す る composite language の パ タ ー ン を, quality word お よ び Japanese で を は languages use い て definition し, each words に つ い て の extraction accuracy を review 価 し た. TMREC term extraction テ ス ト ベ ッ ド で は, statistics of heavy み pay け を with い な い パ タ ー ン spare で, existing の シ ス テ ム よ り よ い パ フ ォ ー マ ン ス を out す こ と が わ か っ た. こ れ は, Japanese で は saw し た と こ ろ composite language の 単 a は Jane 単 に definition で き そ う で あ る が, be interstate に は き め fine か い definition が め extremely important で て あ る こ と を shown す も の で あ る. 3 仏 の 訳 seaborne 専 door term extraction パ タ ー ン を definition, evaluation of 価 す る た め に, day 仏 science and technology term の デ ー タ を made し た.

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Comparable Corpora for Terminology Practice
用于术语实践的可比语料库
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

影浦 峡其他文献

図書館情報学基礎(シリーズ図書館情報学, 1)
图书情报学基础(图书情报学系列1)
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    根本 彰;影浦 峡;海野 敏;三浦 太郎;三輪 眞木子;河西 由美子;倉田 敬子;芳鐘 冬樹;鈴木 崇史
  • 通讯作者:
    鈴木 崇史
補論 飯田風越高等学校との交流から
补充文章:来自与饭田风越高中的互动
Early Childhood Education in Three Culutures -China, Japan and the United States-
三种文化中的幼儿教育——中国、日本和美国——
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中小路 久美代;岡田 猛;川嶋 稔夫;山本 恭裕;新藤 浩伸;木村 健一 ;影浦 峡;樟本千里・西坂小百合;新藤浩伸;岩立京子;室井眞紀子・岩立京子;岩立京子;新藤浩伸;Kyoko Iwatate
  • 通讯作者:
    Kyoko Iwatate
翻訳と意思決定
翻译和决策
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bey;Y. Kaguera;K;and Boitet;C;影浦 峡
  • 通讯作者:
    影浦 峡
幼児理解と評価のための指標に対する保育者の認識 ーカリフォルニア州のDRDP指標を用いてー
儿童保育工作者对理解和评估儿童的指标的看法 - 使用加州的 DRDP 指标 -
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中小路 久美代;岡田 猛;川嶋 稔夫;山本 恭裕;新藤 浩伸;木村 健一 ;影浦 峡;樟本千里・西坂小百合;新藤浩伸;岩立京子;室井眞紀子・岩立京子
  • 通讯作者:
    室井眞紀子・岩立京子

影浦 峡的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('影浦 峡', 18)}}的其他基金

専門語彙成長モデルの構築と多言語専門用語辞書拡張への応用
专业词汇增长模型构建及其在多语种专业术语词典扩充中的应用
  • 批准号:
    24H00736
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Developing a translation process model and constructing an integrated translation environment through detailed descriptions of translation norms and competences
通过详细描述翻译规范和能力,开发翻译流程模型并构建集成翻译环境
  • 批准号:
    19H05660
  • 财政年份:
    2019
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (S)
翻訳における下訳・修正訳と機械翻訳出力の分析
翻译中的粗译/更正翻译和机器翻译输出分析
  • 批准号:
    20650020
  • 财政年份:
    2008
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research

相似海外基金

A novel damage characterization technique based on adaptive deconvolution extraction algorithm of multivariate AE signals for accurate diagnosis of osteoarthritic knees
基于多变量 AE 信号自适应反卷积提取算法的新型损伤表征技术,用于准确诊断膝关节骨关节炎
  • 批准号:
    24K07389
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Unlocking mine waste potential: carbon sequestration and metals extraction
释放矿山废物潜力:碳封存和金属提取
  • 批准号:
    LP230100371
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Linkage Projects
Extraction and Use of Highly Explainable and Transferable Indicators for AI in Education
高度可解释和可转移的人工智能教育指标的提取和使用
  • 批准号:
    23K25698
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
PROTSENS Rethinking Alternative PROTein Extraction: Decoding SENsory-Protein Extraction Relationships
PROTSENS 重新思考替代性蛋白质提取:解码感觉-蛋白质提取关系
  • 批准号:
    EP/Z000785/1
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Fellowship
Wide-area low-cost sustainable ocean temperature and velocity structure extraction using distributed fibre optic sensing within legacy seafloor cables
使用传统海底电缆中的分布式光纤传感进行广域低成本可持续海洋温度和速度结构提取
  • 批准号:
    NE/Y003365/1
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Research Grant
Objective Measurement and Analysis of Fibre Extraction
纤维提取的客观测量和分析
  • 批准号:
    10089054
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Collaborative R&D
BuildZero: transforming the UK's buildings for zero material extraction, zero carbon and zero waste
BuildZero:改造英国建筑,实现零材料开采、零碳和零废物
  • 批准号:
    EP/Y530578/1
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Research Grant
I-Corps: Translation potential of a miniaturized biotechnology platform for nucleic acid extraction, purification, and library preparation
I-Corps:用于核酸提取、纯化和文库制备的小型生物技术平台的转化潜力
  • 批准号:
    2421022
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Standard Grant
RII Track-4:@NASA: Automating Character Extraction for Taxonomic Species Descriptions Using Neural Networks, Transformer, and Computer Vision Signal Processing Architectures
RII Track-4:@NASA:使用神经网络、变压器和计算机视觉信号处理架构自动提取分类物种描述的字符
  • 批准号:
    2327168
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Standard Grant
CAREER: Understanding Electrochemical Metal Extraction in Molten Salts from First Principles
职业:从第一原理了解熔盐中的电化学金属萃取
  • 批准号:
    2340765
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了