東芝2つのAI技術発表 オンライン教育・密回避に貢献

 東芝は6月9日、with/afterコロナに関わる2つのAI技術の説明会をオンラインで開催した。 はじめに、同社研究開発センターの岩田憲治氏が学校のオンライン授業向け音声自動字幕システム「ToScLive」の説明を行った。「ToScLive」は、同社が開発した音声認識AIによって、講師の音声を字幕化し学生に配信するシステムだ 開発に至った背景には、新型コロナウイルス感染症の拡大による急激なオンライン化の進行がある。大学では半数近くでオンライン授業を行っていると言われるなかで重要となるのが、授業の質の向上だ。同社が開発したシステムを導入すれば、講師の音声を字幕化し学生に配信するので授業音声の聞き逃しに対応できる。また高精度の音声認識性能により、字幕を見ただけで発言内容が理解できるレベルを達成。 加えて、簡単に利用できる使い勝手の良さも魅力だ。様々な会議システムとの併用が可能なほか、マイクとの接続と音質を利用者が例文を話して確認する「マイク設定確認機能」も搭載しており、マイク設定の誤りによる音声認識への悪影響を回避できる。専門用語登録支援ツールでは、講義テキストから専門用語を自動抽出可能。これにより音声認識精度も向上する。  慶応義塾大学と法政大学で実証実験を開始予定。聴覚障害者の情報保障や、議事録作成支援にも取り組んでいる。担当者は、「1年から1年半後を目安に商品化を目指したい。そのためにもまずは使ってもらって、双方向コミュニケーションなどの細かい機能への対応を行っていきたい」と、多様な用途への展開も目指す。     ◇ 続いて、同社研究開発センターの山地雄土氏と柴田智行氏がCPU上で高速・高精度に人物の密集度合いを計測する画像解析技術の説明を行った。  この技術は、監視カメラの画像から密集状態を発見・通知することで、店舗や公共施設内の状態を把握できるようになり、密集緩和対策の検討ができるようになる技術だ。人物の密集度合いを一般的なCPU上で高速・高精度に計測できる点が、最も大きな特長だ。 開発に至った背景は、様々な場面で画像から混雑度を把握したいニーズがあることが挙げられる。公共施設の混雑抑制やイベントの円滑な運営などのほか、昨今では新型コロナウイルス感染症の拡大により、“密”な状態を迅速かつ高精度に検知・通知するニーズも高まった。 そこで同社は、人数カウントAIを用いて監視カメラの画像から群衆計測AIを使い、密集状態を検知することを可能にした。同社の深層学習を用いた群衆計測AIでは、独自の手法で世界トップレベルの人数推定が可能だ。 今までは、深層学習方式の解析はGPUなどの画像処理に特化した高価な演算装置の導入が必要であり、導入の障壁になっていた。同社は一般的なPCにも搭載されているCPUにより高速で解析ができるシステムを開発し、1分間に約180台のカメラ画像を処理することが可能となった。 計測精度も世界トップレベル。人物の大きさに対応した正確な検知技術で精度向上を実現した。また、画像の中で混雑している個所を“密度マップ”として可視化することも可能だ。 この技術により、監視の平準化・省力化が図れるほか、滞留箇所が可視化できることで密集緩和対策への貢献が期待できる。担当者は、「どこでも・手軽に・簡単に動作が可能な点と処理速度の速さが魅力。今後は車両など解析対象を広げていきたい」と更なる発展に意欲を見せる。