音声認識

ASCII.jp:NEC、経路制御や裁判員を支える音声認識などを公開

こんな記事を見つけました。
「裁判員を支える音声認識」だそうです。

リンク: ASCII.jp:NEC、経路制御や裁判員を支える音声認識などを公開.

裁判員裁判を支える音声認識技術  このVoiceGraphyの技術は、いよいよ始まった裁判員裁判用法廷への採用も決まっているという。裁判員裁判では、法廷で行なわれた被告人質問などの内容をテキスト化し、裁判官と裁判員が行なう評議の資料として使う。すでに新聞テレビなどで報じられているが、このテキスト化にはNECの音声認識技術が使われているのだ。

 すでに、裁判員裁判を行なうすべての法廷に導入されており、8月の裁判員裁判の公判を目標に、検証が行なわれているという。方言を話す多くの人も公式の場では標準語を使うが、関西弁の人はそのまま関西弁を使うことが多いという。そのため、本製品においても、標準語に加えて関西弁の認識が対応済みとなっている。

いかにも法廷のやり取りが,すぐテキストになって評議のときに資料として配られると,誤解されそうな記事です。
実際は,映像と音声のインデックスとしてしか使えないもので,それも2割以上の確率で誤変換しているので,検索しても漏れるところが多々出てきそうです。

関西弁が対応済みなのは,音声認識研究の総本山の京都大学が関西にあるので当たり前で,そのほかの地方の方言・なまりは未対応のまま手つかずです。

方言だけでなく,通訳人などの言葉も認識できないようです。

また,音声認識の誤変換は,言ったことと違っても,文字的には正しい文字と文章で出てくるので,読むと間違った方向につい引っ張られてしまいます。
誤変換があると分かっていても,活字になっているのを読むとつい信じてしまうのが人間で,評議のときに音声認識で文字化したそのままが表示されるのは,とても危険なことだと思います。

音声認識で文字化されたものを利用して公判調書を作成するのも,間違いのもとだと思います。

音声認識を信じる最高裁のお偉いさんが,この10年,速記官制度を廃止に向かって進めてきました。

まだ未熟な音声認識システムを入れることは,裁判員を支えるどころか,支柱を外しているのではないかと思います。

とにかく今,法廷では,音声認識の機械に場所は取られるし,騒音と熱風で証言が聞き取りづらく,とても邪魔になってます。
4億円も掛けてわざわざ環境を悪くしている感じです。

法廷の音声認識システム

法廷の音声認識システムの記事の追加情報です。

毎日新聞で,笠松弁護士が,「速記官と組み合わせて利用していくべきだ」とコメントを寄せてくださっています。認識率8割でも、かなり間違いが多い印象で、何か悪条件が一つでもあれば、音声認識はすぐに認識率5割とかにどんと下がります。

速記官なら、マイクの向きが悪くても、雑音が入っても、方言でも平気です。

http://mainichi.jp/kansai/archive/news/2009/01/15/20090115ddn012040048000c.html
始まる裁判員制度:関西弁もほぼ正確 音声認識システムテスト--大阪地裁

 5月に始まる裁判員制度に向け、最高裁が開発した「音声認識システム」が14日、大阪地裁でテスト運用された。法廷での証言などを数分で文字化するもので、確認したい証言部分の映像と音声を、後から検索できる。多くは正確に文字化されたが、関西弁を交えたテストでは一部で変換ミスがあった。最高裁によると、大阪地裁を含め全国160の裁判員裁判法廷に3月までに設置する予定。

 テストで大阪地裁の職員が「ちょっと、数えきられへん」と証言すると、検索用のパソコン画面には「ちょっとか、そい切られへん」との文字が出た。ただ、これ以外はほぼ、声の通りに再現され、文字で検索すると、書記官席から小型カメラで撮った証言の様子が画面に映し出された。

 最高裁によると、同システムは裁判員裁判で活用され、有罪・無罪や量刑を決める評議で使われる。06年度から開発が始まり、現在、話した言葉の約8割を正確に文字化できるというが、大阪弁護士会の笠松健一弁護士は「速記官と組み合わせて利用していくべきだ」と話している

【北川仁士】
毎日新聞 2009年1月15日 大阪朝刊

また,名古屋の音声認識システムのことも記事になっていました。
模擬裁判で台本もあり,職員が演じたにもかかわらず,「その後」が「その棒」,「低温」が「14」と,誤変換が目に付いたようです。

http://chubu.yomiuri.co.jp/news_kan/kan090116_1.htm
法廷のやりとり再生 音声認識システム公開
名古屋地裁

裁判員裁判の評議の際に、法廷で録画・録音した証人尋問などのやりとりを再生できる「音声認識システム」が15日、名古屋地裁で公開された。機材を設置した名古屋、東京、大阪の3地裁の計8法廷で稼働状況を確認し、3月下旬までに裁判員裁判を実施するすべての法廷に、機材を設置する。

 同システムは、評議の場で、裁判員に尋問の様子を正確に思い出してもらうのが狙い。証人や被告人を、正面に取り付けたカメラで撮影し、発言は文字情報にして記録する仕組み。発言者や時間、キーワードを入力すれば、再現したい場面をすぐに再生できる。

 この日は、警察官を証人とする模擬証人尋問が行われ、警察官役の裁判所職員が実況見分について証言している様子を記録した。撮影後、パソコン上には、検事とのやりとりが一問一答の形で表示された。「その後」と発言した部分が「その棒」と表示されるなどの変換ミスが一部にあったものの、映像の検索には影響がなかった。

 最高裁総務局の氏本厚司第二課長は「システムは裁判員の記憶を喚起するための道具。尋問の様子を再度、見るために検索するので、誤変換が少しあっても問題はない」と話していた。
(2009年1月16日  読売新聞)

http://mainichi.jp/area/aichi/news/20090116ddlk23040222000c.html
裁判員制度:証人尋問や被告人質問を瞬時に再現 新システム、地裁で試験運用 /愛知
 ◇裁判員の評議に活用を
 5月に始まる裁判員制度に向け、証人尋問や被告人質問のやり取りを録画し、評議の場ですぐに検索・再生できる「音声認識システム」の試験運用が15日、名古屋地裁で行われた。

 裁判員・裁判官が被告の有罪・無罪や量刑を判断する評議の場で、証人尋問や被告人質問の内容を確認したい場合に、内容を瞬時に動画で再現できるシステム。尋問や質問のやり取りを文字データとして認識するため、パソコンに発言者や発言内容などのキーワードを打ち込んで検索すれば、必要な部分を絞り込んで再生できる。

 名古屋地裁ではこの日、システムを使った模擬の証人尋問を報道関係者に公開した。検察官役と証人役のやり取り終了後、「血痕」といったキーワードを入力すると、その発言場面の映像がモニターに映し出され、音声も流れた。

 最高裁によると、システムで文字化された記録は、あくまでも動画を検索するために活用し、公式には残さないという。この日の尋問のやり取りでは「低温」という発言をシステムが「14」と誤って認識するケースがあったが、最高裁担当者は「認識率が8割程度あれば実用に耐えられる」と話した

 システムは最高裁が06~08年度に4億円かけて開発。3月下旬までに全国計160の裁判員裁判用の法廷すべてに設置する。名古屋地裁では903号、604号法廷に設置し、今後、実際の公判でも試験的に運用する。【式守克史】

毎日新聞 2009年1月16日 地方版

asahi.com(朝日新聞社):関西弁、苦手ですわ 大阪地裁で音声認識システム初披露 - 関西ニュース一般

リンク: asahi.com(朝日新聞社):関西弁、苦手ですわ 大阪地裁で音声認識システム初披露 - 関西ニュース一般.

大阪の朝日新聞の記者さんは、誤変換をよく見ていたようです。
模擬裁判で、職員がしゃべってこれではと、心配する感じの記事になっています。

関西弁、苦手ですわ 大阪地裁で音声認識システム初披露 2009年1月14日

 市民が審理に参加する裁判員裁判で、被告や証人が法廷で話した内容を評議の際に確認するための「音声認識システム」が14日、大阪地裁で公開された。

 発言をすぐに文字にしてパソコンに記録し、被告らの映像とともに再生できる。06年の開発以来、方言の表現が最大の課題だが、この日も関西弁の「数え切られへん」は「か、そい切られへん」。

 最高裁によると、関西圏の法廷はほかの地域より方言でのやりとりが多いという。市民からは「ほんまに大丈夫かいな」といぶかる声も。

(写真有り---証人役の大阪地裁職員(画面左下)が話した内容をすぐに文字で映し出す音声認識システム=14日午後、大阪市北区の大阪地裁、宮崎園子撮影)

証言内容を映像再生 評議室で確認可能 【あなたが裁く 迫る裁判員制度】:産経関西(産経新聞大阪本社公式ニュースサイト)

リンク: 証言内容を映像再生 評議室で確認可能 【あなたが裁く 迫る裁判員制度】:産経関西(産経新聞大阪本社公式ニュースサイト).

大阪地裁に大阪弁対応の音声認識システムが備え付けられ、ニュースになりました。

産経新聞は「記録」に使うかどうかの点にまで触れているのと、誤認識のハプニングのことをわざわざ書いているのがおもしろいので、御紹介します。

「血痕」の検索は、キーワードがよかったようでうまくいったようですが、実務で使い出せば誤認識のハプニングだらけでしょうね。

4億円掛けて、このシステムでは8割しかめざせないことが分かり、最高裁も気が済んだことと思います。

5年前には95%の認識率を達成しているという話だったのに、今では目標が8割です。

速記官なら、校正者なしの1人リアルタイムで文字表示させても9割以上はいきます。

これから幾らの予算を掛けて160の法廷に設置したり、研修を行ったり、維持管理するのか分かりませんが、使い物にならないお荷物システムになるのは目に見えているのに、止めることはできないのでしょうか。

2009年1月15日
証言内容を映像再生 評議室で確認可能 【あなたが裁く 迫る裁判員制度】
 今年5月に始まる裁判員制度で、評議室で証言内容を確認するための「音声認識システム」がほぼ完成し、14日、大阪地裁で初めて公開された。大阪、東京、名古屋の3地裁の各2法廷にシステム機器を設置し、試験的に運用。3月末までに全国約160法廷に配備して裁判員制度の開始に備える。

 「血痕の採取は何回くらいしましたか」

 「刑事生活は二十何年してますが、数えきられへんですね」

 この日大阪地裁では、血痕が落ちていた現場の実況見分を行った刑事に対する検察官の模擬尋問を実施。数分後にパソコンで「血痕」のキーワードで検索すると、冒頭の検察官の質問から続くやりとりの映像が大画面に流れた。

 音声認識システムは平成18年に最高裁がNECに委託し、約3年かけて開発。法廷に小型カメラを設置して撮影するとともにマイクで質問や証言を拾い、短時間で文字化して記録する。

 評議室で裁判員の求めに応じて裁判官がパソコンで言葉をキーワード検索すれば、文字化された記録が大画面に映し出される。さらに詳しく確認したい文字の部分を選択すれば、大画面で裁判員が見る映像も再生できる仕組みだ。

 審理直後の評議でも正確な検証を実現するのがねらい。ただ、文字化された記録は誤認識もあるため公式には残されず、速記録を別に作成するという。
 大阪地裁に設置したシステムには、標準語に加え関西弁を認識するプログラムを搭載。冒頭の刑事の証言が誤認識されるハプニングもあったが、最高裁担当者は「8割程度の認識率があれば検索はできる」と強調。目標だった8割はほぼ達成しているという。(2009年1月15日 08:46)

北國新聞 金沢弁「変換できんげん」

リンク: 北國新聞ホームページ - 石川のニュース.

音声認識システム導入で法曹関係者が気をもんでいるというニュースです。

私が思うに、石川県の法曹関係者の予想は正しいだろうと思います。

地方の法廷で方言を使わないのは絶対無理!

皆で方言を使わないように努力しても、なまりまでは直せないし、限度があります。

方言で聞き出す戦術の弁護士さんや、お国言葉が身に染みついた高齢者の方や、特に方言のきつい組織関係の人たちに、標準語を強要するのも無理と思います。

石川県内の法曹関係者は「裁判官が言い換えを確認して対応するのではないか」と思っているようですが、どこまでそれで対応できるか。
裁判員裁判で、専門用語にも気を遣い、そのうえ機械にも方言が分かるように気を遣い、でも機械は記録を作成してくれないのでメモ書きもしなければいけないし、4億円も掛けて大変さを増しているだけのような。

速記官を使ってくださいと言いたいけど、石川県に速記官がいないのがつらいところです。

◎金沢弁「変換できんげん」 法廷の音声、文字で記録 新システム、標準語仕様

裁判員用に改修された法廷。音声認識システムが配備される=金沢地裁
 「まっし」は「しなさいよ」へとうまく変換できる?五月から始まる裁判員制度で音声と映像を記録する「音声認識システム」が導入されるのに伴い、法廷で飛び交う金沢弁が認識されるのか、法曹関係者が気をもんでいる。録音した供述などを自動的に文字変換して記録するが、標準語仕様となっているため。お国言葉に即座に反応する「りくつ(巧み)」なシステムとはいかないようだ。
 法曹関係者によると、被告人質問や証人尋問などで方言が使われることが想定される。犯行の手口や現場の様子を説明する際、「わりゃくさん(おまえ)、いさどい(態度が大きい)と怒鳴られた」や「あてがいなこといっとんなま(いい加減なこと言うな)」、「室内はむたむたやった(散らかっていた)」「柱がかたがって(傾いて)、壁によしかかった(もたれた)」など、金沢弁が飛び出す可能性がある。「機械が方言まで正確に認識するのは無理だろう」(法曹関係者)という。

 システムは最高裁が二〇〇五年度以降、約四億円をかけてNECに研究委託して開発。発言中の単語から映像を検索、再生可能で、裁判員が審理内容を素早く確認できる。金沢地裁など全国約百七十カ所の裁判員法廷に配備される。

 システムは昨年五月に東京地裁で公開された。模擬の証人尋問では、システムが収集した質問や証言内容はほぼ正確な文字列で自動的にパソコン画面に表示され、「けっこん」は文脈から最も近い「血痕」に変換された。

 ただ、標準語仕様のため、関西地方の法廷では地元の言葉が使われる頻度が高く、実用配備までに対応が検討されている。

 システムが全国各地の方言まで幅広く対応するのは困難とみられ、石川県内の法曹関係者は「裁判官が言い換えを確認して対応するのではないか」とみている。

音声認識システムによる文字データを当日中に提供?

2008年7月発行の日弁連新聞414号に、次のような記事が載っています。

最近の新聞報道や、最高裁が職員にしている説明と違っていて、首をかしげることばかりです。

裁判員音声認識システム

「文字列から画面検索」

 裁判員裁判の評議においては,法廷の証言の確認が必要になる場合が予想される。その際に証言を録画したDVDから,すばやく必要な場面を検索するためのツールとして,最高裁は音声認識システムの開発を続けていた。

この度,試作品の完成をみたことから,5月末から東京地裁の一部法廷でこのシステム利用が試行されている。
 このシステムは,録画された証言につき,証人等の発言内容を文字化して別ウインドウで逐次表示するものである。後で,例えば「実況見分」という文字列を検索すると,その言葉が発言されている場面(複数場面)が検索できるシステムとなっている。裁判員はこのシステムを用いる。文字化の精度は9割程度であるが,目的の場面を素早く探すためには十分の水準である。弁護人にも尋問のあった当日中に,音声データと文字データの提供等がなされる予定である。

この記事によると、文字化の精度は9割となっていますが、最近の新聞報道では「8割の認識率をめざす」という表現でした。

弁護人に、尋問のあった当日中に、文字データの提供がされることも初耳です。

また、発言内容を文字化して別ウインドウで逐次表示というのも、裁判員の目の前に表示されたり、検索も裁判員自身でできるかのように誤解する人もいるかもしれないです。

最高裁から弁護士への説明が足りてないように感じます。

もっとも、5年ぐらい前のIBMの音声認識システムのときの最高裁の説明ビデオでは、精度が95%で、裁判用語を足せばすぐ実用化できるとか、調書も作ると説明していたので、その説明がまだ弁護士さんの中で信じられたままになっているのかもしれません。

最高裁は、裁判員裁判の公判記録がどうなるかについて、もう少しきちんと弁護士さんたちに説明したほうがよいと思います。

音声認識システム、検索・再生だけにあと何億?

6月23日、最高裁の総務局+情報政策課,人事局,経理局が、裁判所職員の労働組合である全司法との交渉で説明した内容です。

【音声認識システム】
音声認識システムの研究開発の状況については,先日,職員管理官から説明したとおりである。今後も,職員及び職員団体に対しては,必要に応じて説明していきたいと考えている。
 音声認識システムについてはシステムにより得られた文字データを映像・音声データとリンクさせ,文字データをいわばインデックスとして利用することによって,証言等の中から評議での確認に必要な部分を検索し,速やかに映像及び音声で再現することを念頭に置いて,映像関連機能として盛り込むことを前提としてシステム構築を行ってきたことは,先日,職員管理官から説明したとおりである。
 システムで得られた認識結果(文字データ)を利用して検索する場合,通常はキーワードの多くがきちんと認識されている上,検索方法としては,このほかに,発言がされた時間を入力して検索する方法(その場合は,何時何分から前後何分間と範囲を指定することも可能である。)や発言者を特定して検索する方法も可能としており(これらのクロス検索も可能である。),検索に支障はないと考えている。今後とも,現場の意見等をふまえながら実際の運用に支障がないようなシステムを構築していくとともに,できるだけ高い認識率を実現することを目標に,引き続き研究開発を行いたいと考えている。

 
あと、最高裁と全司法本部とのやりとりで、組合側は、「音声認識システムについては,調書への活用も期待していたが,評議におけるインデックスとしての機能にとどまっている。さらなる認識率の向上を求める。また,プロトタイプを東京だけでなく多くの庁に設置してもらいたい。」と要望しました。

それに対して最高裁は、「平成21年の開始時にできるだけ高い認識率となるよう研究開発をすすめている。プロトタイプの設置は,今回は業者が立ち会ったり,作業を行う際の都合により東京以外では考えていない。東京地裁で行っているテスト結果をCD-ROMに記録し,配布する予定なので,それを見てもらって,意見があれば出してもらいたい。なお,最終検証として,12月には幾つかの庁でテスト運用を行うことを検討しているので,規模がどのくらいになるのかは分からないが,要望は承ることとしたい。」と回答しました

評議のときに、裁判員が、あのときどう言っていたかをもう一度確認したいという、検索システムだけのものに、約5年と4億の費用を掛けてきたことになります。

それすらも、これから12月になってやっと幾つかの庁でテスト運用してというぎりぎりの日程で、全国の様々な方言が飛び交う法廷で実際に使い物になるかどうかは、まだ未定です。

最高裁は、最初に調書を音声認識システムで作成すると言っていたのだから、潔く失敗を認めて、路線変更をすべきです。

これ以上、認識率の向上を求めても、全国の方言に対応している音声認識システムなどどこでも開発されていませんし、法廷の様々な人がしゃべる生の言葉のやりとりを直接認識させる方法で、高い認識率など幾らお金を掛けてもできるはずがありません。

最高裁に、高い認識率を求めることは、無駄にもう何億円もつぎ込むことと、貴重な時間の浪費になります。

最高裁が失敗を認め、路線変更して、裁判所速記官の裁判員への活用を決めてくれれば、検索・再生システムはもちろん、公判調書も提供できるし、視聴覚障害者に逐語の文字通訳も提供できるのにと残念です。

法廷の音声認識システムの進行具合

 11/7 最高裁から久々に音声認識システムの研究開発についての情報が明らかにされました。

 音声認識システムについては,NECが昨年より研究開発を始めて,今年も継続して昨年同様1億数千万円の予算で2年目に突入しています。

 昨年から東京地裁の法廷で音声データを収集していますが,うまくいかなかったようで,今度はマイクをピンマイクに替えて,本年3月から5月までの間,東京地裁の2法廷で音声データの収集を行ったそうです。

 その結果,市販の機器では操作が煩雑であったり,音量が小さいなどの課題があったそうで,NECで音声認識システム専用のピンマイクの開発に取り組んできたそうです。

 そして,この度,めでたくピンマイクの試作品が完成したということで,その性能等を検証するために,改めて,東京地裁の同じ法廷で,そのピンマイクによる音声データの収集を行うこととにしたのでお知らせするという内容でした。

 試作器は,スイッチ操作の簡易化が図られたこと,プリアンプを登載することにより自動
での音量調整が可能となったこと,マイクヘの電源供給器を内蔵することにより機器のコンパクト化を実現したことなどの特徴を有するそうです。

 難航しているんだろうとは予想していましたが,ここまで進んでないとは。

 音声認識システムの入口にさえまだ入っておらず,音をつかまえるところでつまずいていたんですね。

 ピンマイクにしたところで,人間は180度首を縦と横に振る動物で,つい最近,私も失敗したところです。

 左襟にピンマイクを付けて,思いっきりスクリーンのある右を向いてしゃべって,小さな声でプレゼンをして,字幕付けの速記官に迷惑を掛けてしまいました。

 ピンマイクでも大丈夫なのかなと思います。

 

 

最高裁の音声認識システムの研究開発状況,1億3000万を掛けた1年の成果

 5月30日,最高裁が音声認識システムの研究開発状況について明らかにしました。
 最高裁は,音声認識についてはもう何年も研究開発を行っており,掛けたお金も1億3000万円どころではありませんが,NECのこの1年の成果は,次の程度のようです。
 
* …… * …… * …… * …… * …… * …… * …… * …… * 
(以下,最高裁の説明です。)
 音声認識システムの平成18年度の研究開発の概況と平成19年度以降の作業予定の概要等は次のとおりである。

 音声認識システムについては,平成18年度に,研究開発業者として日本電気株式会社(以下「NEC」)を選定し,裁判所用の言語モデル,音響モデル及び音声認識エンジンを登載した音声認識ソフトの構築と,機器構成や操作画面等の検討を中心とした作業を進めているところである。

 音声認識ソフトの構築については,法廷での供述について安定した高い認識性能を確保することを研究開発の主な目的の一つとして位置付け,これまでに蓄積してきた調書データ(録音反訳の反訳書の電子データ)及び東京地裁の刑事法廷において収集している音声データを利用して,言語モデル及び音響モデルを強化したほか,NECが保有する種々の音声認識技術を投入するなどの作業をしてきており,一定の認識性能の向上が確認されたところである。

 音声データの解析作業においては,当事者本人・証人,検察官・弁護人,裁判官という各発話者グループごとに異なる特徴があることが確認され,また,パソコンのキータイプ音や紙をめくる音等が音声認識に悪影響を与えることも判明した。平成18年度においては,そのような認識率を低下させる言語的又は音響的な要因に対処するとともに,検察官及び弁護人の発話中の移動に対する対策として,従来のスタンドマイクによる音声データの収集に加えて,ピンマイク装着による収集を行い,音声収録系統の改良の有効性を検証するなどの作業も行ってきたところである。

 また,音声認識システムについては,当面,裁判員制度での利用を念頭に置いて,裁判員制度の具体的な運用等も視野に入れつつ,研究開発を進めているところである。裁判員裁判においては,評議において裁判員が法廷における証人等の供述内容を確認するためのツールが必要となるところ,裁判員裁判の評議における裁判員等の記憶喚起等のために証人尋間等を録画する法整備がなされたところであり,音声認識システムにより得られた文字データを映像・音声データとリンクさせることによって,文字データをいわばインデックスとして利用して証言等のうち評議に必要な部分を検索し,速やかに映像及び音声で再現することが可能になると考えられる。このため,音声認識システムについては,逐語調書作成事務の効率化に用いるのみならず,裁判員との評議において,特定の供述を検索し,映像・音声によってその内容を確認するためのツールとして利用することを念頭に置き,映像関連機能を盛り込むことを前提としてシステム構築の検討を行っている。
 平成19年度においても,平成18年度に引き続き,様々な話者や話題,環境に対応できるよう音響モデル及び言語モデルの構築等の作業を進める予定であり,別途説明するように。東京地裁における音声データの収集を継続するほか,裁判所間における音響環境の差異がシステムに与える影響を分析したり,方言(関西弁)への対応を検討したりするために,東京高裁管内及び大阪高裁管内の一部の地裁においても,それぞれ一定時間の音声データの収集を行う予定である。また,音声収録系統については,背景雑音や回り込みの音声を除去する技術についての検討を行う予定であり,機器構成や操作画面等についても,裁判員裁判法廷及び評議室における運用イメージを踏まえて,職員が利用しやすいものとするべく検討していきたいと考えており,職員の意見=要望等も踏まえながら、システムの構築に努めていきたいと考えている。
 なお、裁判員裁判の運用に支障が生じないよう研究開発を進めていく必要があり,研究開発の進捗状況にもよるが,平成20年度のなるべく早い段階で複数の法廷にプロトタイプ(試作機)を設置してテスト運用をしていきたいと考えている。

* …… * …… * …… * …… * …… * …… * …… * …… *
(また,全司法とのやりとりでは,以下のようなことが明らかになっています。以下,全司法情報より引用です。)

組合 音声認識システムの現在の認識率はどのくらいなのか。

当局 裁判員裁判での利用を念頭に置いて,実用化に向けた研究開発を今まさに進めているところであり,また,自由発話における認識率は発話環境等によって異なることから,現段階で何%という―定の確定した数値を示すことまできないが,いずれの事件においてもできるだけ高い認識率を確保できるよう,研究開発を進めていきたいと考えている。

組合 発話者グループごとの異なる特徴とはどのようなものか。

当局 当事者本人や証人については,他の話者グループと比べて認識率が低い傾向にあり,発音が不明瞭となりやすいこと。発話速度の変動が生じやすいこと,話者や話題が多様であること等のほか,「え一と」「う―ん」等のフィラー(発話の合間に挿入される不要語)が多い等の特徴があった。また,検察官や弁護人については,他の話者グループと比べて認識率が高い傾向にあり,平易な言葉遣いが多い一方,本来音声の入るべきマイクに音声が入らなかったり,音声が他者のマイクに回り込むことがあること等の特徴があった。さらに,裁判官については,検察官や弁護人と比べて認識率が低い傾向にあり,文法の乱れや専門的な表現が少なくないこと等の特徴があった。

組合 関西弁以外の方言にはどのように対処するのか。

当局 法廷での方言の使用状況と研究開発の進捗状況を踏まえながら,今後検討していくことになる。

組合 文字化についてはどういった状況にあるのか。

当局 音声認識システムが実用化された場合でも,一定程度の誤認識部分が生じることは避けられず,誤認識部分を確認し,修正する作業が必要になると考えている。この誤認識部分の修正については,音声認識システムの研究開発の進捗状況を見ながら,録音反訳業者の利用も視野に入れて検討していきたいと考えている。

組合 評議における文字の活用についてはどのように考えているのか,

当局 連日的に開廷される裁判員裁判においては,記憶が鮮明なうちに審理が進められ結審後速やかに評議が行われて判決が宣告されることになることから,当事者や裁判体が,審理や評議の過程において,公判調書を用いて証人等の供述内容を確認する必要性は低いと考えている。
また,裁判員に大部の調書を読んでもらうことは,過大な負担を与えるものであり,現実的でない。むしろ,裁判員の記憶喚起が必要な場合に,証人の供述等を録画した記憶媒体を再生して,必要な供述部分を映像及び音声で確認することが効果的であると考えている。

組合 評議において記憶喚起等を図るためには,紙の方が一覧性に優れているのではないか。

当局 確かに,記憶媒体には紙と同質の一覧性はないが,音声認識システムで得られた認識結果である文字データを映像及び音声データとリンクさせることによって,文字データをいわばインデックスとして利用して,証言等のうち評議に必要な部分を検索し,速やかに映像及び音声で再現できるよう研究開発を進めているところである。さらに,紙の公判調書とは異なり,記憶媒体の再生は映像と音声でなされるため,供述の際の証人の状況といったものも含め供述についての裁判員の記憶喚起という面では,より効果的であると考えている。

組合 弁護人や検察官といった訴訟関係人は,公判調書を用いて証人等の供述内容を確認したいというニーズがあるのではないか。

当局 公判調書が未整理の間の当事者の記憶喚起の便宜等のため,当事者に対して証人尋間の状況等を録取した録音体を再生する機会を与える旨の規定を最高裁判所規則等に新たに設けるなどして,裁判員裁判の審理に支障がないようにしていきたいと考えている。

組合 裁判員裁判における速記官の逐語録作成についてどう考えているのか。

当局 裁判員裁判の審理及び評議のために公判調書を作成する必要性はないと考えているが,他方,上訴審での審理等のために逐語録を作成する必要があると考えており,録音反訳方式に加えて,速記官による逐語録作成も含めて検討していくことになる。

組合 音声認識システムの機材構成はどうなるのか。

当局 機材構成については,現在,研究開発の進捗状況を踏まえながら検討中であり,説明できる段階になれば説明したいと考えている。

組合 評議室での機器の操作はだれがすることを想定しているのか。

当局 基本的には裁判官が行うことを想定しており。例外的に書記官や事務官が入室して操作の補助をすることも全く考えられないわけではないものの,書記官や事務官が評議室で機器の操作を行うような運用は基本的には想定していない.

組合 音声認識システムを法廷に設置するスケジュールはどう考えているのか。

当局 裁判員裁判での運用に支障が生じないよう。なるべく早い時期に設置して実際の運用に備えたいと考えている。
以 上
* …… * …… * …… * …… * …… * …… * …… * …… *

以下は,感想です
・1億3000万も掛けて,現物も見せられない,認識率も示せないとは,どういうことでしょうか。
・「パソコンのキータイプ音や紙をめくる音等が音声認識に悪影響を与えることも判明した」 こんなことが,わざわざ1億3000万円掛けて調べることでしょうか。
 速記官なら,経験上よく分かっていることです。ちなみに,雑音では,咳をされるのが一番困ります。空調,マイク,パソコンの冷却ファンの音,街宣車の騒音,電車の騒音,芝刈り機の音,工事の音,携帯電話の音,鳥の声など,法廷の雑音は多彩ですが,それは来年また1億円掛けないと出てこないのでしょうか。
  
・方言も,大阪弁の対応を検討するために,来年は音声データの収集を大阪地裁で行うようですが,それ以外はどうするのでしょうか。そもそも,NECは方言に対応できると思っているのでしょうか。形だけやっている振りをしているようにしか見えません。
 
・パソコンで調書を作成するとは言っておらず,音声認識を反訳業者に修正させるというようなことが書かれていますが,書記官に校正させたら暴動が起きるような代物なのでしょうか。

・「組合 裁判員裁判における速記官の逐語録作成についてどう考えているのか。」
 「当局 裁判員裁判の審理及び評議のために公判調書を作成する必要性はないと考えているが,他方,上訴審での審理等のために逐語録を作成する必要があると考えており,録音反訳方式に加えて,速記官による逐語録作成も含めて検討していくことになる。」

 速記のことを言うのに,わざわざ録音反訳に加えておまけのように検討するんだという言い方をするあたりに,現在の最高裁の速記官に対する意地悪さが,よく出ているなと思いました。
 最高裁にいるえらい方は,大抵裁判官のはずなのですが,人権意識を疑います。

・現在の音声認識の技術では,自然発話に対応するのは無理とはっきり言わずに,また来年も契約を延長して,研究開発の振りをして1億何千万かをせしめるNECにもあきれはてます。

 インデックスに使うのも,認識率が低い上に,事件ごとの専門用語や固有名詞の対応など無理で,結局,書記官が打ち込むほうが正確,確実ということになりそうです。
 
 でも,何億も掛けたものを導入したら使わない訳にはいかないし,場所をとって邪魔なうえに,使用の手間や,メンテナンス料が継続して掛かるなど,何億も掛けてとんだ厄介者を作っているような気がしてなりません。
 

朝日新聞夕刊4/25の記事

今日の夕刊1面に,次のような記事が掲載されました。
http://www.asahi.com/national/update/0425/TKY200704250091.html

「裁判員時代の公判調書、自動化なるか 方言認識など課題」

余りにも無責任でひどい記事なので,少しでも誤解を減らすように書いておきたいと思います。

まず,音声認識の問題は,方言認識の課題まで,とてもたどりついてないはずです。
法廷で話されるのは,原稿の読み上げなどではない「自由発話」であり,更に,2名とは限らない「複数話者」の発言を処理しなければなりません。
法廷で行われるやり取りの中身も,質問で追いつめていく高度な言葉の駆け引きです。明瞭に答えないどころか,わざとあいまいにしてごまかそうとする発言が多く,不明瞭なところほど大事な発言ということがよくあります。
せっかく引き出した大事な答えを,アナウンサーのような明瞭な音声でなかったからといって,認識できませんでしたなどでは済みません。ましてや,誤変換は許されません。
法廷のやり直しのきかない一度きりの大切な証言を,海外の法廷でも例のない,生のやりとりを直接音声認識させるという方法でやろうとする最高裁の気が知れません。
今年度はNECにつぎ込んだお金は1億3000万でしたが,これから何億つぎ込んでいくことになるのか,いつ出来上がるのか,技術的に作ることが可能かどうかさえ,「複数話者の自由発話」はこれから開発しなければどこにもない技術だけに予想がつきません。
そして,「自由発話」や「複数話者」の壁を乗り越えても,登録しておかないと決して正確には出ない「固有名詞」問題があります。そして,どこも手を付けていない「方言・なまりの問題」と続きます。
2年後の裁判員制度開始時に,音声認識で調書ができるという人は,今裁判所の中にはいないでしょう。
検索,「頭出し」も,どの程度のものができるか不明です。
現在,最高裁は,「裁判員制度では必ずしも公判調書は必要でない」という言い方をするようになりました。そして,刑事訴訟法の一部を改正して,法廷でのビデオ録画を可能にできるように法制審にかけて進めているところです。

「公判調書,自動化」は,既にIBMがやって頓挫していることで,なぜ朝日新聞の記者が今こんな夢のようなことを書くのか,理解に苦しみます。

最近のトラックバック

2018年10月
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31