青森放送株式会社

Keywords

#サーバレス#AWS#Amazon Bedrock#Amazon Transcribe

青森のローカル局 RABが取り組む放送業界向けDX推進とは?ヘプタゴンメンバー三浦・石澤が取材突撃してみた

Client

青森放送株式会社

1953年の開局以来、70年以上にわたり青森県の基幹メディアとして、テレビ・ラジオの放送事業を通じて地域の情報発信を担う。日本テレビ系列局として全国ニュースネットワークに加盟しながら、「RABニュースレーダー」をはじめとする地域密着型の報道番組や、青森県の文化・伝統を伝える自社制作番組を多数展開。青森県全域の詳細な情報を日々発信し続けている。

https://www.rab.co.jp/

青森県を放送対象地域とする日本のローカル局のRAB青森放送では、記者の取材後の原稿作成などDX推進の取り組みとして、自社で「dahande」という文字起こしツールを開発しました。

ヘプタゴンはdahandeの事業構想の壁打ちから開発などの技術面まで一貫してご支援しました。dahandeの開発の舞台裏をRAB 内山様と高嶋様、ヘプタゴン 開発メンバーの石澤と三浦が対談形式で振り返りました。

目次

  1.  青森のローカル局「RAB」が推進する、放送業界DXの取り組みと実情
  2.  記者の業務を効率化したい!という思いで生まれた文字起こしツール「dahande」
  3.  dahandeの文字起こしの精度をAmazon Bedrockを採用することで向上
  4.  「すごく楽ちん」外出が多い報道記者のかゆいところに手が届く体験設計に辿り着くまで
  5.  ヘプタゴンのアジャイル開発は、お客様の声を聞きニーズにあったシステムを即時的に作ること
  6.  ローカル局の課題解決「dahande」を他テレビ局に横展開する未来をRABが担いたい

青森のローカル局「RAB」が推進する、放送業界DXの取り組みと実情

ーー 今回ヘプタゴンはRAB様の社内の報道記者の方々が使用する文字起こしツール「dahande」の技術支援をさせていただきました。開発をご依頼いただいた背景や課題感について教えてもらえますか? 

高嶋:RABでは社内でDXを進めて、業務効率を高める流れがありまして、選挙対応など記者の業務負荷を下げるための取り組みをまずはやってみようと。青森の地元企業にお願いしたかったのと、ヘプタゴンの開発メンバーの三浦さんがテレビ局経験者だったので、話がスムーズにいくかなということで、お声がけさせていただきました。

ーー 社内のDX推進ではdahande以外に取り組まれていることはありますか?逆に苦労しているところも。

高嶋:AIアナウンサーの導入も検討したのですが、クオリティの問題がクリアできなかったのと、人員の効率化という効果を検討した際に、アナウンサーの人員は効率化できたとしても、エンジニアの人員は必要になる。人員がなくても業務が完結するシステムだったら理想なのですが、そこまでいっていないのが現状なので導入は見合わせました。DXって人員を抜本的に効率化するというよりかは、これまでやっていたことがどれだけ改善できたのか、の方が評価指標として重視されます。RAB社内のDX推進でも難しさを感じますが、業務改善効果の可視化や、現場レベルでの効率化や効果の算出が重要です。

ーー そうなのですね。テレビ局からヘプタゴンに転職された三浦さんはこうした業界的な課題についてどう考えますか?メディア・テレビ局は、デジタル化やDX推進が他の業界とくらべて進んでいるのかも含め。

三浦:進んでいるか、進んでないかだと、明らかに進んでないですね。背景としては、社内のシステムのほとんどが、インターネットに繋がらない前提で作られている。昔からある社内システムに新しいシステムを繋ぎ込もうとするから、複雑化しています。短い期間でデジタル化やDX推進による効果を出したい、っていう場合は、従来のシステム環境外で対応していく必要があると思います。

高嶋:そうなんですよね。さらにセキュリティをとても厳密にしなきゃいけないので、新しいシステムの導入のハードルがそもそも高いという面もあります。

ーー 業界的にはネットワーク的に分けなきゃいけないから、単純にシステムを導入するっていうのが難しい土壌なんですね。

三浦:みなさんが使っている端末だと、さすがにもうすべてインターネットに繋がっていますが、専用端末など環境によってはインターネットにつながっていないこともある。そういう場合は、他の端末で作業をしないといけない。

各社それぞれのセキュリティポリシーがありますが、基本的には境界防御でスパッと分けるみたいな感じですね。動画編集するシステムは多分、完全にインターネットから隔離されている。クライアントはギリギリ繋がってる端末に置いてあるけど、サーバーは、ネットワークを2つ挟んでいて、切り分けてやってる、というのが一般的ですね。

ーー 全国と地方だと、システムをつくることは一緒なのかなと思うんですけど、予算とかITツールの習熟度みたいなところで、差を感じられたりしますか。

高嶋:ありますね。地方局だと、開発費に巨額のお金をかけるっていうのはなかなかできないので、その中で小回りが効くところにチャレンジするときに、ローカル局とキー局だと、ローカル局の方はそういうリスクを大きく取りづらいっていうのがあります。キー局は他部署にわたったシステムが必要。あとは系列にも含めてっていうことが必要になってきます。逆にローカル局だと過剰な部分もあるので、シンプルなものをつくることで、逆にいろんな人に、分かりやすい、使いやすいって支持されることにつながります。

ーー シンプルの方がよいですね。

高嶋:多機能で良い面ももちろんありますが、逆に、そこまで必要かな、とかですね。コストを考えたときに、どこまでかっていうところになると思うんですけども。

記者の業務を効率化したい!という思いで生まれた文字起こしツール「dahande」

ーー 今回ヘプタゴンが伴走支援したdahandeについて話を聞いていきたいのですが、どういう課題感が具体的にありましたか?

高嶋:最近では、取材時の字幕は必須で求められるようになっていますが、一字一句直す作業を人の手でやるとものすごく時間がかかります。特にニュースの場合、政治家の発言をしっかり文字起こしすることが重要です。言った言わないの話になると大問題なので、ここをチェックするのは必須でした。ただ、文字起こしの際に、どうしても人の耳で聞いて、文字起こしをする流れだと、労力もかかる。

内山:今回dahandeは選挙取材の文字起こしで使用したので、選挙で例を出すと、選挙に行って、第一声を撮ってきました。帰ってきて、その第一声を一斉にみんな文字起こしをします。大体日付をまたいでいたのですが、今回に関しても9時にみんな帰りました。選挙中なのに。こんなに早く帰っていいのかなって思いました。現場のときに欲しかったです(笑)。

高嶋:スピード感的に政治家の発言を全文でインターネットに載せて、どういうことを言ってるのかっていうのを、リアルタイムで特設ページで公開できました。

三浦:候補者一人ひとりの方の全文文字起こしですよね。いまの時代、フェイクニュースが増えているので、候補者が言ってることや言ってないことを確認できるような役割をもたせています。こうした活動を続けることで、ニュースの形を変えていけるとよいかなと。

ーー これまでっていうのは、記者さんが自分で、手作業というか人が録音した音声を聞くことをやっていたのですか?

高嶋:そうです。あとは取ってきたVTRを編集機で動かしながら、文字起こしをぱぱぱって一文字ずつ手打ちしていきます。0.8倍とかにして、ちょっとゆっくりにしてみたいな。

三浦:私も新人の時お前タイピングが早いだろって言われてやっていました(笑)。どうしてもマンパワーというか。

高嶋:今でもキー局でもそういうスタイルですね。だからシステムが役立ったなと感じるところです。

ーー RABの記者さまたちのdahandeの活用は円滑に進みましたか?

高嶋:現状のdahandeはドラッグアンドドロップでデータをアップロードできるUIですが、最初のバージョンはファイルのアップロードが階層構造になっており、直感的に操作できない画面だったと思います。

内山:個人的には階層構造でフォルダーでファイルを管理するのには慣れていましたが、ただ、アルファベットが並ぶと苦手意識が生まれる方や、一定の年齢層の方はフォルダ名を漢字にできませんか、みたいなのがあったので、その辺の人たちにとっては、ドラッグアンドドロップになってからは、見た目で直感的に分かるようになったので利用が促進されましたね。

dahandeの操作画面キャプチャ

dahandeの文字起こしの精度をAmazon Bedrockを採用することで向上

ーー dahandeの最初のバージョンでも使えそうだけど、操作性が一歩だったという感じですかね。

高嶋:そうでしたね。ただ、操作性以外の文字起こしの精度はすごいなと思って、きっちり字起こしされるんだ!とびっくりしました。実はdahandeの前に既存システムで文字起こししていたこともありますが、セキュリティ的に不安があったので、ヘプタゴンさんにご協力いただいて内製化できたのはベストだと思っています。自社でやるよりは、アマゾンのクラウドの方がセキュリティが高いでしょうし。

ーー 既製品と比べると、精度やどういうところがより良いでしょうか?

高嶋:文章としてはクリアですね。点が入ったり、余計な言葉が削除されてたり。とても見やすいです。

ーー dahandeの開発側で、工夫した点はありますか?

石澤:そうですね、今回一番苦労したことは処理をLLM、AIにやらせている部分になりますと。なのでそれをするためのプロンプトですね、AIの指示っていうところが一番工夫したところですね。「あー」とか「うー」とかを除外しつつ、意味の通る文章で、変更しすぎないっていうのをとても注意しました。

高嶋:非常に見やすいなと思っています。出来上がった文章がすごく読みやすくていいなと思って。

三浦:AI先生が捏造したり、でっち上げちゃったり、言ってないことを文字にしちゃったりとか、結構あるんです。正確性っていうのを大事にするために、余計なことをしないっていうのをやっていますね。

石澤:とにかくAIにガードレールを作って「これはダメ」「これはちがう」っていうのを元の表現の機微を崩さないように、バランスよくチューニングしていきました。

高嶋:ニュースの場合、表現の機微だったりニュアンスだったりが大事になるので、そこはすごくありがたいですね。 

ーー 地名もやりましたよね?

三浦:地名は、結局辞書登録をするような感じで最初やりました。青森の全地名のリストももらったのですが、ファイルが大きすぎて読めなくなってしまったので、主要なところだけインプットしました。他には、今回選挙で参院選だったので、出馬されてる方の政党の名前と候補者のお名前に関しては、辞書に最初に入れて、あとは原発の話など繰り返し出てきそうな単語はインプットしました。ここをいじったら簡単に用語を追加できますよ、というレクチャーを内山さんにしましたね。候補者の名前と政党名がビシッと出てたので困らなかったとおっしゃっていました。

ーー 逆に精度というと、こういうふうな間違いが出たなっていうのって、あるんですか。

内山:「むつ」っていう地名を辞書登録しました。ひらがななので、珍しい地名です。「むつ市」は全国初のひらがな市なんですが、「六つ市」になってたりとかっていうのはありましたね。あとは「陸奥湾」。これもやはり「六つ湾」、湾が六つになっちゃったんです。「むつ市」だと、ひらがなの「むつ」で「むつ市」なんですけど、「陸奥湾」だと漢字の「陸奥」なんで。またそこはちょっと独特です。一応それは入力して登録したんですけども。

高嶋:だいたい20分、30分ぐらいの話の中だと、直さなきゃいけないところっていうのは、5、6か所とかっていうのはありますね。ただ、表現というよりは、区切るところもちょっと、立ったり、あと、似たような表現みたいなところが、違う感じになっちゃってたりとか、なかなか政治家の方々はもう、昔の名言や慣用を言うので、そういったに一般的じゃない部分は人間の目で見て直していきました。

「すごく楽ちん」外出が多い報道記者のかゆいところに手が届く体験設計に辿り着くまで

ーー dahande導入前の人力による文字起こしと、dahandeを導入後の文字起こしだとどのくらい差がありますか?

高嶋:例えば、選挙用の1週間分ぐらいまとめて撮影したインタビューは1人につき3時間ぐらいかかっていました。それが、1/3から半分くらい短縮できるようになりました。時間以外の労力の面からも、全部一から書く作業が ”ちょっと直すだけ” の作業になりました。作業負荷が大幅に改善されたので、そこもすごく助かる、という感じです。

ーー 今後社内でどのように展開していく流れになりそうでしょうか?

高嶋:まさにこれからですが、社内資料を準備して、報道部局にさらに活用を促進していきたいです。部局内でテストマーケティングしてみたところ、dahandeは使い方が難しくないこともあり、簡易な説明で自発的に活用する報道部員がでてきました。とっつきにくいなぁと漠然と考えているひとに積極的に勧めていきたいです。あとは、汎用性があるので、他のテレビ局さんにも紹介していきたいです。

三浦:報道の方にとっては直感的に、すぐ使える、ということがとても重要な要素になりますよね。今回dahandeのユーザーインターフェース(以下、UI)の初期構想の際のイメージに宅ファイル便が挙げられていました。宅ファイル便のUIのキモはドラッグアンドドロップでファイルをアップロードできるところにあるので、そうした体験をdahandeでも作れると報道記者の方々のかゆいところに手が届くのかなと考えました。

三浦:より詳しくお話しを伺うと、報道の方はiPhoneのボイスメモを使って、主に取材の録音されることが多い。それをそのまま簡単にアプローチする方法は何かないですか、とお話しされていた。モバイルを想定してどうにか簡単にシステム上で体験をつくれないかないなと試行錯誤していて、パソコン上で動くプロトタイプを1日中ずっと触ってたら「あれ、ドラッグアンドドロップはどうかな」と閃きました。ボイスメモのページからそのまま長押しして、ページ変えて、サファリを開いてドロップしたらアップロードができると。たまたま見つけました。

高嶋:それすごく楽ちんなんですよ。本当にものの数秒で録音した音声ファイルをアップロードするところまで持っていける。それこそ出先で。録音してファイルをアップロードすれば帰りの移動ですぐ文字起こしされた取材内容を確認できる。

三浦:アップロードのところ、最初は上手く動かなかったんです。アップロードするファイルの拡張子をiPhoneだとmp4オーディオに明示的にしてあげたらドラッグアンドドロップで、上手く動いてくれました。これも何個か試していくうちにできました。

高嶋:報道記者の現場でよくあるのが、録音したけども、録音が長すぎて送れないというケース。あとは出先でパソコン開くまでの時間がないという声があったので、やっぱりどうしてもスマホアプリの要件は外せませんでした。現場の記者たちがツーステップぐらいですごく楽になってよかったです。

三浦:もともとファイルの受け渡しにはチャットアプリを使っていましたよね。ファイルの制限が結構厳しかった印象です。

高嶋:そうですね。取材は長丁場になることもあるので、その分データ量も増えてアップロードができないこともありました。こうした長尺のデータを分割する作業は大変で手間がかかる。dahandeだと一発でアップロードが完了するので、本当にありがたいです。

立花:dahandeはテレビ局や放送局向けの文字起こしツールですが、テレビ局や放送局ならではの機能はありますか?

高嶋: dahandeにはタイムコードの自動付与があります。何秒のところに、どんな発言があるのか一目でわかる。聞き直すときに便利ですし、テレビ局は、一つのニュースが出来上がるまでに色んな人たちが介在します。だからこそ、情報の客観的な出典元をタイムコードで参照できるのは必須。dahandeの文字起こしのタイムコードで「ここを使って欲しい」「発言の頭何秒から何秒ぐらいを使って」という指示出しを編集マンにできる。この流れがRABの報道部内にできつつあります。

三浦:もともとAmazon Transcribeという文字起こしサービスがあります。ウェブブラウザで読めるvttファイルという字幕・動画の字幕を作るだけのファイルを生成する機能を持っています。これがタイムコードとセリフ一行を一覧化してくれるのですが、dahandeを開発した際に、このファイルを生成AIに流し込んで、句読点でまとめて作ったのがプロトタイプの初期段階でしたね。

石澤:初期段階で実験をしたら上手くいかないことも出てきた。最終的には30秒ぐらいの間隔で音声データをまとめて、プログラムで静的に処理した上でグループを作り、まとまりにして文字の修正をAIに投げるという二段階のペースで実装しました。

ヘプタゴンのアジャイル開発は、お客様の声を聞きニーズにあったシステムを即時的に作ること

ーー dahandeの新規事業開発をヘプタゴンが伴走支援させていただきました。RAB様は開発ベンダーさんと多くお付き合いがあると思いますが、今回の開発プロジェクト全体を通じて率直にどうでしたか?

高嶋:以前、出口調査のアンケートシステムの開発を依頼した、システム開発会社は非常にクラシックなスタイルの開発をされる会社でした。「ここからここまでしかやれません」というスタイルで、1と言ったら1、5と言ったら5というスタイルですね。こうしたスタイルと比較して、ヘプタゴンは新規事業という要件がファジーな環境下でも期待以上のものを作ってくださいました。開発スタイルもクラウド主導で進めてくれたので、細かい要件の際定義など柔軟に調整してくれました。

三浦:ありがとうございます!ヘプタゴンのシステム開発は、作ったものを定期的に見てもらって、フィードバックをもらって開発を進めるということを繰り返す、アジャイル開発を採用しています。高嶋さんに仰っていただいたやり方を得意としていたので、その部分を評価してくださって嬉しいです。

高嶋:ヘプタゴンはかゆいところに手が届く開発の仕方をしてくれてたので、非常にありがたいと思っています。

内山:あと、テレビ局の内情を知っている、ヘプタゴンの三浦さんがいたのはやはり大きな決め手でした。テレビ業界のシステム開発は独特で、例えばタイムレコードの尺もこの秒数や幅だったらテレビ的に使いやすい、っていうのがあります。こういうことを言わすもがなでdahandeのシステム開発に落とし込んでくれた。すごく助かりました。

三浦:1分だと長いですもんね。政党名順に入力してくれたりとか。支援者的な立場だと、dahandeの完成度が6割ぐらいのタイミングで高嶋さん、内山さんにもプロトタイプとしてさわっていただき「どうですかね」とフィードバックをもらうことを何回か繰り返しました。このやり取りをさせていただいたので、「ああ、ここを変えたいな」とか「ここは変えないでおこう」という判断ができた。ログインは無くせないんですか、みたいな話もありましたが、データフルオープンになっちゃうのでここだけは絶対に譲れないです、みたいな話もありましたね(笑)。

実は、ヘプタゴンのやり方が合わないという方も結構いまして「なんで決まってないこと勝手にやるの」とかいうお声も時折いただきますが、RAB様とのdahande開発の伴走支援はとてもやりやすかったです。

RAB様は最終的なゴールや成果物のイメージが擦りあったら、手段はヘプタゴンにまかせます、というスタンスでした。だからこそ、ヘプタゴン社内でも「まずはこっちで試して、だめだったらこっちの手法を試そう」という試行錯誤ができました。実はdahandeには技術的にも新しいことを実装しているのですが、こうした技術的な挑戦ができたのは自由度をもたせてくださった高嶋さんや内山さんがいたからだと思います。

高嶋:正直なところ、私自身今回dahandeを開発するにあたり、報道記者の仕事の流れをあらためて分析して、ヘプタゴンの三浦さんや開発チームのみなさんの知識をお借りして、こういう風にしたいなっていう理想を具現化してもらいました。個人的には、無茶なオーダーや要望ばっかりで恐縮でしたが、最終的なゴールとして「文字起こしがきちっとできて、報道記者のみんなが使いやすいもの」であればプロセスはどうでも全然問題ないとは思っていました。逆に、プロセスの部分でいかに工夫できるかがヘプタゴンの腕の見せどころかなとも思っていたので。

ローカル局の課題解決「dahande」を他テレビ局に横展開する未来をRABが担いたい

ーー RABのDXの先駆けとして、dahandeの文字起こしシステムを社内に取り入れた前後で、DXに対する意識の変化はありましたか?

内山:やっと、踏み出せたかなと、まずそのDXしなきゃいけない、なんかちょっと変えなきゃいけないっていうのがあった中で、何からやっていいんだろうっていうのがあったんですけど、まずは今回その文字起こしっていう、比較的にハードルが低いところから、取りかかれたんで、ひとつ実績ができて、次のステップに進みやすくなったと思います。

ーー dahandeに対するまわりの声はありますか?

内山:まだ限定的ではあるんですけれども、部署外からもこんなに精度いいんだ、っていう声は結構寄せられています。

高嶋:社内はもちろんですが、今後はほかの地方局との連携も強化していきたいです。放送局って言っても、キー局と準キー局に分かれていたり、我々のような小さいローカル局もあります。RABのようなローカル局は、システムの導入に手間や負荷がかからず、シンプルで使いやすく、コストパフォーマンスも優れているものを求めているので、dahandeがまずはその先駆けとして、テレビ局のあいだで紹介され、広まってほしいと思います。

内山:「メイドインアオモリ(Made in 青森)」のシステムとして、青森発の放送業界向けシステムとして広げていきたいです。たとえば、これをテレビ局に横展開して、各地ご当地カスタマイズしていけると面白い。

RABのマスコットキャラクター「らぶりん」

三浦:面白いですね。

内山:放送業界視点での他の課題でいくと、テレビ局って机の上が汚いんですよ。

三浦:確かに、机の上には物が多いですね。こんなに紙を刷るんだと入社したときに思いました。編成部員とかずっと印刷してるじゃないですか。何部刷っているのかと思って。

内山:書類がいっぱいの放送業界から極力紙を少なくすることで「みんなの机の上を綺麗にする」。これをクラウドでやるっていうのが一番の最終目標です。

ーー そういえば「dahande」というサービス名ってそういう意味合いも込められているのですか?

内山:ダハンデは青森の方言で津軽弁です。意味合いとしては、「なぜなら」とか言葉と言葉をつなぐ意味ですが、さらに理由を加えるとしたら「ハンディ」「便利」ですね。普段の手作業を便利にしていくという意味合いで、ダハンデ、ダ・ハンディ。

三浦:ちゃんと意味はあったのですね。

内山:Chat GPTからの提案でした(笑)。手助けは便利な意味も込めて、人の手間を減らすし、使う人の味方になりますよね。なんて便利なんだ、って言いたくなる名前としてdahande。

ーー 名前って大事ですよね。やっぱり広めるっていうところでは、キャラクター的なのもすごい大事だと思います。そこが最初に出てきたのがすごいさすがだなと思いました。

内山:名前は愛着に関わりますね。ちなみに、アイコンを作り始めたら愛着も生まれてきました。三浦さんからのアドバイスでもあったのですが、アイコンがホーム画面に表示されるとやっぱ嬉しい。

三浦:たとえば、社内説明で「例のシステム」じゃ話が通じない。でも「dahandeが」だと「あ〜あれね!」となる。こうして会話が発展していくと楽しくなりますよね。 

ーー 現状のdahandeの機能で足りないことって何かありますか?

三浦:実は2時間を超える長尺ファイルはまだ動作が不安定なところがあります。最初dahandeの開発のときにいただいたデータの目安は5分程度だったので、そこは問題なく動作したのでRAB様の要望に応えるシステム開発ができたと自負していましたが、いざ現場の方に使っていただくと選挙の演説など長尺のデータはエラーがちょこちょこ出ます、という声が上がってきたと。それでお話を伺ったら、9時間/2GBのファイルが使われるケースもあることを発見しました。こうしたところの精度は第3フェーズの開発として支援していきたいです。

内山:あと他局への展開についても考えていきたいですね。

三浦:技術的に要検討ですが、dahandeのアカウントのドメインを変えて、アカウントを分けたら他局に展開できそうな気もしています。RAB様の知見やアイデアがいっぱい詰まったdahandeをマネタイズもしつつ、うまいこと広めていきたいなとは考えています。値付けとかシステム側でうまくやっていきたいですね。

内山:そうですね。でも、こうしたサービスって育つものっていうのも思うので、学習データを増やして、逆にガラパゴス化させて、日本のローカル局に特化させても良いかなと。岩手弁をインプットするとか、秋田弁をインプットするとか。

三浦:地名だけでも結構大変ですね(笑)。

高嶋:方言に特化して、それが字幕として精度高く文字起こしできるとよさそうだなとか。他方では、報道だけで使うとか制作だけで使うとかでも変わってきそうです。

内山:dahandeを使った感じだと、長尺の番組よりは報道的な瞬発力のあることに使った方が向いてるなとは思いました。じっくりやる番組よりは、新規性が強いニュースや別作業と並行して進める文字起こしといった使い方が合うかもしれません。こうしたところも今後使っていく中でヘプタゴンさんと検証していければと思います。

ヘプタゴンメンバー一同:ありがとうございました!