DaVinci Resolveで字幕を自動生成する方法【Studio機能解説】
DaVinci Resolve Studioの「Audio to Subtitle」で音声から字幕を自動生成でき、無料版ではWhisper等の外部ツールで代替可能。
はじめに
動画に字幕を付けたいけれど、手作業でテキストを一つひとつ入力していくのは気が遠くなる。そんな経験はありませんか?
特にYouTube動画やSNS向けコンテンツでは、字幕の有無が視聴維持率を大きく左右します。音声をミュートにしてスクロールする視聴者にリーチするためにも、字幕は今や「あれば便利」ではなく「必須」に近い存在になっています。
DaVinci Resolve Studio(有料版)には、音声を自動で文字起こしして字幕を生成する「Audio to Subtitle」機能が搭載されています。この記事では、その自動生成の手順から字幕のスタイル調整、SRTファイルの書き出し、さらに無料版ユーザー向けの代替手段まで幅広くカバーします。
DaVinci Resolve認定トレーナーとして延べ1万人以上の受講者に動画編集を教えてきた経験をもとに、実際の運用で押さえるべきポイントをわかりやすくお伝えしていきます。
DaVinci Resolve Studioの字幕自動生成機能「Audio to Subtitle」とは
音声認識による文字起こしの仕組み
DaVinci Resolve Studio(バージョン18.5以降)には、タイムライン上の音声を解析して自動で字幕トラックを生成する「Audio to Subtitle」機能が搭載されています。これはAIベースの音声認識エンジンを利用しており、話者の音声をテキストに変換し、タイムコード付きの字幕として配置してくれます。
ポイントは、この機能がDaVinci Resolveの中だけで完結すること。外部のサービスにアップロードする必要がないので、プライバシーが気になる案件や企業向け動画でも安心して使えます。
有料版(Studio)限定の機能
注意しておきたいのは、Audio to SubtitleはDaVinci Resolve Studioの限定機能であるという点です。無料版のDaVinci Resolveでは利用できません。字幕トラックの作成や手動での字幕入力は無料版でも可能ですが、音声からの自動生成だけはStudioが必要になります。
「自動生成のためだけにStudioを買うべきか?」と迷う方もいるかもしれませんが、Studioにはこの他にもGPUアクセラレーション、ノイズリダクション、HDRツールなど多数の追加機能があります。字幕自動生成を入り口として導入を検討するのも十分合理的な判断です。
Audio to Subtitleで字幕を自動生成する手順
事前準備 — 字幕トラックの追加
まず、Editページでタイムラインに字幕トラックを追加します。タイムラインの左側のトラックヘッダー部分を右クリックして「Add Subtitle Track」を選択すれば、字幕専用のトラックが作成されます。
字幕トラックはビデオトラックやオーディオトラックとは別に管理されるため、既存の編集を崩すことなく字幕作業を進められます。
自動生成の実行
字幕トラックを追加した状態で、タイムラインメニューまたは字幕トラックの右クリックメニューから「Audio to Subtitle」を選択します。ここで言語の選択画面が表示されるので、音声に合った言語を指定してください。
解析の処理時間は動画の長さやPCのスペックに依存しますが、10分程度の動画であれば数分で完了するのが一般的です。処理が終わると、字幕トラック上にタイムコード付きのテキストブロックが自動で配置されます。
認識精度を上げるためのコツ
自動生成の精度は、音声のクオリティに大きく左右されます。以下の点を意識しておくと、修正の手間を減らせます。
- マイクに近い距離ではっきりと発声する
- BGMや効果音のボリュームが大きすぎると認識精度が落ちる
- 複数の話者が同時に話す場面では誤認識が起きやすい
- 録音環境のノイズが多いとテキストが乱れやすい
延べ1万人以上に教えてきた中で感じるのは、「自動生成の結果を100%信用しない」という前提で運用することが、結果的にもっとも効率的だということです。完璧な認識を目指すよりも、80%の精度で一気に生成してから手動で仕上げるほうが、トータルの作業時間はぐっと短くなります。
対応言語と日本語の認識精度
サポートされている言語
Audio to Subtitleは多言語に対応しており、英語、日本語、中国語、韓国語、スペイン語、フランス語、ドイツ語など主要な言語をカバーしています。言語の選択は自動生成の実行時に指定でき、一度に1つの言語のみ選択します。
日本語の実用レベル
日本語の認識精度ですが、ナレーションや解説系の動画であれば、はっきりとした発声であれば実用レベルの結果が得られます。ただし、いくつかの場面では注意が必要です。
認識が得意な場面: 一人の話者がはっきりと標準的なイントネーションで話す解説動画、ナレーション、インタビュー(一人ずつ話す形式)
認識が苦手な場面: 専門用語や固有名詞が多い内容、早口や口語表現が多いトーク、BGMが大きい環境、複数人が同時に話す場面
自分のYouTubeチャンネル(登録者6万人超)でも字幕を付けることがありますが、DaVinci Resolveのチュートリアル動画のような落ち着いたトーンの解説であれば、修正箇所は全体の2〜3割程度に収まることが多いです。一方、テンポの速い雑談系の動画ではもう少し修正が必要になります。
生成された字幕の編集・修正方法
Editページでの直接編集
自動生成された字幕は、Editページのタイムライン上で直接ダブルクリックしてテキストを修正できます。誤認識された部分を正しいテキストに打ち替えていくのが基本的な修正ワークフローです。
字幕のタイミング調整も直感的で、字幕ブロックの端をドラッグして開始・終了のタイムコードを変更できます。話し始めと字幕表示のタイミングがずれている場合は、ここで微調整しましょう。
Inspectorパネルでの詳細編集
画面右側のInspectorパネルでは、選択した字幕ブロックのテキスト内容、表示時間(Duration)、タイムコードを数値で正確に指定できます。複数の字幕ブロックを分割・結合する操作も、Inspector経由で行えます。
長すぎるテキストブロックを2つに分割したい場合や、逆に短い字幕同士をまとめたい場合など、自動生成の区切り方が最適でないときに活躍します。
効率的な修正の進め方
字幕の修正作業を効率的に進めるには、まず動画を通しで再生しながら誤りをチェックし、気になった箇所にマーカーを打っておく方法がおすすめです。通し再生後にマーカーを順番に辿って修正すれば、何度も巻き戻す手間が省けます。
字幕のスタイルカスタマイズ — フォント・色・位置
フォントとサイズの変更
字幕のデフォルトスタイルはシンプルな白文字ですが、Inspectorパネルの「Style」セクションからフォント、サイズ、カラーを自由にカスタマイズできます。
日本語字幕のフォント選びでは、視認性の高いゴシック体が定番です。Noto Sans JPやヒラギノ角ゴシックなど、太めのウェイトが用意されているフォントを選ぶと、動画の背景に埋もれにくくなります。
色と背景(バックグラウンドボックス)の設定
文字色は白が基本ですが、背景が明るいシーンでは読みにくくなることがあります。対策としてよく使われるのが、文字に半透明の背景ボックスを付ける方法です。Inspectorの「Background」オプションを有効にして、黒の50〜70%透明度に設定すると、どんな背景でも安定した視認性を確保できます。
ドロップシャドウやアウトラインを付ける方法もあります。YouTubeの字幕でよく見かける「白文字+黒アウトライン」の組み合わせは、背景ボックスなしでも視認性が高く、映像の邪魔になりにくいスタイルです。
表示位置の調整
字幕の表示位置は画面下部中央がデフォルトですが、「Position」パラメータで自由に変更できます。画面下部にテロップやロゴが入る場合は、少し上に移動させるといった調整が必要になることもあります。
SRT・VTTファイルの書き出し
書き出し手順
DaVinci Resolveで作成・編集した字幕は、外部ファイルとして書き出すことができます。Editページで字幕トラックを右クリックし、「Export Subtitle」を選択すると、保存形式と保存先を指定できます。
対応フォーマットはSRT(SubRip Subtitle)とVTT(WebVTT)が主なものです。SRTはもっとも普及している字幕形式で、YouTubeへのアップロードにもそのまま使えます。VTTはWeb用途に適しており、ブラウザベースの動画プレイヤーとの親和性が高い形式です。
YouTubeへの字幕アップロード
書き出したSRTファイルは、YouTube Studioの字幕設定画面から直接アップロードできます。YouTubeの自動翻訳機能と組み合わせれば、日本語の字幕をベースに他言語の字幕を自動生成することも可能です。
一度SRTファイルを作成しておけば、別の動画プラットフォームへの転用や、翻訳会社への外注時のベースデータとしても活用できるので、字幕ファイルの書き出しは習慣にしておくと後々便利です。
無料版ユーザー向けの代替手段
OpenAI Whisperを使った文字起こし
DaVinci Resolve無料版でもStudio相当の字幕生成を実現したいなら、OpenAIが公開している音声認識モデル「Whisper」が有力な選択肢です。
Whisperはオープンソースで、ローカル環境で動作します。動画から音声を抽出してWhisperに渡すと、SRT形式のファイルを出力できます。そのSRTファイルをDaVinci Resolveの字幕トラックにインポートすれば、Studio版のAudio to Subtitleとほぼ同じ結果を得られます。
日本語の認識精度もかなり高く、特に「large」モデルを使用した場合は、DaVinci Resolve Studioの内蔵機能と遜色ないレベルです。ただし、モデルのダウンロードと実行にはある程度のPCスペック(特にGPUメモリ)が必要になる点は留意してください。
YouTubeの自動字幕を活用する方法
もっと手軽な方法として、YouTubeの自動字幕機能を活用するアプローチもあります。動画をYouTubeに非公開でアップロードすると、Googleの音声認識エンジンが自動で字幕を生成してくれます。
YouTube Studioの字幕管理画面からSRTファイルをダウンロードし、DaVinci Resolveにインポートするという流れです。精度はWhisperに比べるとやや劣ることがありますが、追加のソフトウェアインストールが不要という手軽さは大きなメリットです。
外部SRTファイルのインポート方法
WhisperやYouTubeで生成したSRTファイルをDaVinci Resolveに取り込むには、Editページのメディアプールにドラッグ&ドロップするか、「File」メニューの「Import Subtitle」を使用します。インポートされた字幕は字幕トラック上に配置され、Studio版で自動生成した字幕と同様に編集・スタイル調整が可能です。
テロップと字幕の使い分け
そもそも「字幕」と「テロップ」は何が違うのか
動画制作の現場では「字幕」と「テロップ」が混同されがちですが、本来は役割が異なります。
字幕(Subtitle)は音声の内容をそのままテキストで表示するもので、主に聴覚補助やミュート視聴への対応が目的です。一方、テロップはキーワードの強調、補足情報の表示、演出としてのテキスト表示など、より広い用途に使われます。
DaVinci Resolveでの使い分け
DaVinci Resolveでは、字幕は「Subtitle Track」、テロップは「Text+」や「Fusion Title」で作成するのが一般的です。
字幕トラックはSRT/VTT書き出しに対応しており、プラットフォーム間での字幕データの再利用に向いています。テロップはデザインの自由度が高く、フォント、アニメーション、装飾を自在にコントロールできるのが強みです。
5,000本以上のプラグインを販売してきた経験から言えば、字幕とテロップを両方活用しているクリエイターのほうが、視聴者のエンゲージメントが高い傾向にあります。全編に字幕を付けてアクセシビリティを確保しつつ、要所でテロップを使って視覚的なアクセントを加えるという組み合わせが効果的です。
テロップのデザインに時間をかけたくない場合は、あらかじめデザインされたテンプレートを活用するのも一つの方法です。テロップライブラリ プロのようなプラグインを使えば、300種類のテレビ風テロップをドラッグ&ドロップで挿入でき、字幕で全体をカバーしつつ、見せ場だけ装飾テロップで演出するといったワークフローが手軽に実現します。
まとめ — 要点を行動に
DaVinci Resolveでの字幕作成について、要点を整理します。
Studio版ユーザー: Audio to Subtitle機能で音声から字幕を自動生成できる。日本語も実用レベルで認識されるが、自動生成後の手動修正は前提として運用するのが効率的。
無料版ユーザー: OpenAI Whisper やYouTube自動字幕でSRTファイルを作成し、DaVinci Resolveにインポートすれば同等の結果を得られる。
共通: 生成した字幕はSRT/VTTで書き出してYouTubeなど他プラットフォームでも再利用可能。フォント・色・位置のカスタマイズでブランドに合ったスタイルに仕上げる。
字幕とテロップは役割が異なるので、字幕で全編のアクセシビリティを確保し、要所にテロップで視覚的な演出を加えるのがベストな組み合わせです。まずは短い動画で自動生成を試してみて、修正のワークフローに慣れるところから始めてみてください。
よくある質問
DaVinci Resolve無料版でも字幕の自動生成はできますか?
無料版には音声自動文字起こし機能(Audio to Subtitle)は搭載されていません。ただし、OpenAIのWhisperやYouTubeの自動字幕機能でSRTファイルを生成し、DaVinci Resolveにインポートすることで同様の結果を得られます。手動で字幕トラックを作成・入力する方法も利用できます。
Audio to Subtitleの日本語の認識精度はどのくらいですか?
はっきりとした発声であれば概ね実用レベルの精度が出ます。ただし専門用語や固有名詞、BGMが大きい環境では誤認識が増える傾向があります。自動生成後に手動で修正する前提で運用するのが現実的です。
自動生成した字幕をSRTファイルとして書き出せますか?
はい。DaVinci ResolveのEditページで字幕トラックを右クリックし、「Subtitle Exportメニュー」からSRT形式やVTT形式で書き出すことができます。書き出したファイルはYouTubeへのアップロードや他の編集ソフトでの再利用にも対応しています。





