1. Overview
    概要
  2. Course List
    科目一覧
  3. General Design Courses
    デザイン学共通科目
  4. FBL/PBL
    問題発見型/解決型学習
  5. Open Innovation Practice
    オープンイノベーション実習
  6. Field Internship
    フィールドインターンシップ
  7. Research
    研究事例
  8. Examples of Course Planning
    私の履修書

知識に基づく構造的言語処理の確立と知識インフラの構築 Establishment of Knowledge-Intensive Structural Natural Language Processing and Construction of Knowledge Infrastructure

研究主体
京都大学情報学研究科 知能情報学専攻

 

代表者
黒橋 禎夫(京都大学情報学研究科・教授)

 

メンバー
河原 大輔(京都大学情報学研究科・准教授)
柴田 知秀(京都大学情報学研究科・特定講師)
森田 一(京都大学情報学研究科・特定研究員)
林部 祐太(京都大学情報学研究科・特定研究員)

 

テキストは、専門家によるデータの分析結果や解釈、ステークホルダーの批判・意見、種々の手続きやノウハウなどが表出されたものであり、人間の知識表現の根幹をなすものである。言語の計算機処理はウェブをはじめとする大規模テキストの活用によって長足の進歩を遂げつつあるが、本プロジェクトはこれをさらに発展させ、知識に基づく頑健で高精度な構造的言語処理を実現し、これによって様々なテキストの横断的な関連付け、検索、比較を可能とする知識インフラを構築することを目標としている。

本プロジェクトはCREST研究領域「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」のプロジェクトとして、東北大学 乾研究室、お茶の水女子大学 戸次研究室と共同で2013年10月から実施している。黒橋・河原研究室ではプロジェクトの中心的課題として、知識に基づく文章解析モデルの構築を担当しており、文章解析の基盤となる単語を正確に認識するため、大規模語彙情報と意味的汎化言語モデルに基づく新たな形態素解析手法を考案し、従来法を大きく上回る精度を実現した。さらに、テキストで表現されている意味内容の正確な抽出のために、述語項構造解析・談話構造解析の高度化に取り組んでいる。

また、本プロジェクトの成果を社会の具体的な課題へ適用するため、日立アプライアンス株式会社、日立コンシューマ・マーケティング株式会社、さらにエン・ジャパン株式会社の不満買取センターとの共同研究を実施している。

 

プロジェクトの概要
関連URL
http://nlp.ist.i.kyoto-u.ac.jp/CREST/

 

出版・受賞など

  1. 言語処理学会20周年記念論文賞 河原大輔,黒橋禎夫:格フレーム辞書の漸次的自動構築. 2014年10月4日
  2. Hajime Morita, Daisuke Kawahara and Sadao Kurohashi: Morphological Analysis for Unsegmented Languages using Recurrent Neural Network Language Model, Proceedings of EMNLP 2015, pp.2292-2297 (2015.9.17). 

Organization
Department of Intelligence Science and Technology, Graduate School of Informatics, Kyoto University

 

Project Leader
Sadao Kurohashi (Professor, Graduate School of Informatics, Kyoto University)

 

Members
Daisuke KAWAHARA (Associate Professor, Graduate School of Informatics, Kyoto University)
Tomohide SHIBATA (Lecturer, Graduate School of Informatics, Kyoto University)
Hajime MORITA (Researcher, Graduate School of Informatics, Kyoto University)
Yuta HAYASHIBE (Researcher, Graduate School of Informatics, Kyoto University)

 

Related URL
http://nlp.ist.i.kyoto-u.ac.jp/CREST/

 

Publications and Awards

  1. Hajime Morita, Daisuke Kawahara and Sadao Kurohashi: Morphological Analysis for Unsegmented Languages using Recurrent Neural Network Language Model, Proceedings of EMNLP 2015, pp.2292-2297 (2015.9.17).