技研公開連載② ユニバーサルサービス

東京都世田谷区砧のNHK放送技術研究所で開催される「技研公開2024」(5月30日~6月2日)の見どころを連載でお伝えする。
第2回は、メディアの直近の課題解決に貢献するための“メディアを支える”技術の研究と、いつでも・どこでも・誰にでも必要とされる情報を届けるユニバーサルサービスの研究に関する展示を紹介する。

▽「映像の説明テキスト生成技術」
番組制作の効率化を目指し、映像の内容に関するメタデータを自動的に生成するシステムを展示する。このシステムでは、映像からの代表画像抽出、顔認識、文字認識、人物識別といったさまざまな解析技術を柔軟に組み合わせることで、映像に映る人物の動作や状況を表す説明テキストを自動生成する。出演者の顔から特定した人物名や、映像に映った地名を含む文字列から推定した撮影場所などの情報を利用することで、従来の説明テキスト生成技術では難しかった固有名詞を含む説明テキストの生成が可能になった。

(全文は5月22日号3面に掲載)

画像は「固有名詞を含む説明テキスト生成」

この記事を書いた記者

アバター
成澤誠
放送技術を中心に、ICTなども担当。以前は半導体系記者。なんちゃってキャンプが趣味で、競馬はたしなみ程度。