유튜브 & 미디어 기술

유튜브 자막 SRT 추출 및 다빈치 리졸브 자막 싱크 완벽 가이드

디지털가드너 (Digital Gardener) 2026. 5. 16. 21:55

영상 편집 과정에서 자막 작업은 시청자의 몰입도를 높이는 가장 중요한 단계입니다. 특히 유튜브 영상에서 자막(SRT) 파일을 추출하여 영상 편집 프로그램인 다빈치 리졸브(DaVinci Resolve)로 가져와 싱크를 맞추는 작업은 워크플로우의 효율성을 극대화하는 핵심 기술입니다.

자막 파일의 추출부터 타임라인 배치, 그리고 작업 중 빈번하게 발생하는 프레임 레이트 불일치로 인한 자막 밀림 현상 해결법까지 상세히 정리했습니다.


1. 유튜브 영상에서 SRT 자막 파일 추출하는 방법

유튜브에서 자막을 추출하는 방식은 본인이 소유한 채널의 영상인지, 혹은 참고용 타 채널의 영상인지에 따라 접근 경로가 다릅니다. 가급적 호환성이 가장 뛰어난 SRT(SubRip Subtitle) 포맷으로 다운로드하는 것이 좋습니다.

1) 본인 채널의 영상에서 추출하는 경우 (유튜브 스튜디오)

자신이 업로드한 영상의 자막을 백업하거나 재편집하고 싶다면 유튜브 스튜디오를 이용하는 것이 가장 안전하고 정확합니다.

  1. 유튜브 스튜디오 접속: 유튜브 홈 화면 우측 상단의 프로필 아이콘을 클릭하고 '유튜브 스튜디오'로 이동합니다.
  2. 자막 메뉴 이동: 왼쪽 사이드바 메뉴에서 [자막] 탭을 선택합니다.
  3. 영상 선택: 자막을 다운로드하고자 하는 동영상의 제목을 클릭합니다.
  4. 옵션 진입: 설정된 언어(예: 한국어) 우측에 있는 [옵션(점 3개 아이콘)]을 누릅니다.
  5. 다운로드 수행: 메뉴에서 [다운로드]를 선택한 후, 세 가지 포맷(.vtt, .srt, .sbv) 중 [.srt]를 클릭하여 원하는 경로에 저장합니다.

2) 타인 채널의 영상에서 추출하는 경우 (외부 플랫폼 활용)

분석이나 학습 목적으로 다른 채널의 공개된 자막이 필요할 때는 안정성이 검증된 자막 추출 웹서비스를 활용할 수 있습니다.

  1. URL 복사: 자막을 추출하려는 유튜브 영상의 웹브라우저 주소창에서 URL을 복사합니다.
  2. 추출 사이트 접속: DownSub 또는 SaveSubs 등 브라우저 기반의 자막 다운로드 사이트에 접속합니다.
  3. 주소 입력 및 분석: 메인 화면의 검색창에 복사한 유튜브 주소를 붙여넣고 [Download] 버튼을 클릭합니다.
  4. SRT 포맷 다운로드: 시스템이 해당 영상의 자막 파일을 분석하여 언어별 목록을 출력하면, 'SRT' 파일 형식으로 된 다운로드 버튼을 눌러 소스 파일을 확보합니다.

2. 다빈치 리졸브로 SRT 자막 가져오기 및 타임라인 배치

확보한 SRT 자막 파일은 일반적인 영상이나 오디오 소스와 달리, 다빈치 리졸브 내에서 '서브타이틀(Subtitle) 트랙'이라는 특수한 레이어에서 관리됩니다. 다음 과정을 순서대로 진행합니다.

[프로젝트 실행] ➔ [File > Import > Subtitle] ➔ [미디어 풀 확인] ➔ [V2 이상 상위 트랙에 배치]

1) 서브타이틀 파일 인포트 (Import)

  1. 다빈치 리졸브를 실행하고 편집할 프로젝트를 엽니다. 자막을 적용할 마스터 영상과 오디오 클립은 이미 에디트 탭(Edit Page) 타임라인에 배치되어 있어야 합니다.
  2. 상단 메인 메뉴 바에서 [File] ➔ [Import] ➔ [Subtitle...]을 순서대로 선택합니다.
  3. 탐색기 창이 열리면 미리 준비해 둔 .srt 자막 파일을 선택하고 [Open]을 누릅니다.

2) 타임라인 트랙 배치와 정렬

  1. 임포트가 완료되면 미디어 풀(Media Pool) 내에 자막 아이콘 형태의 새로운 클립이 생성됩니다.
  2. 이 자막 클립을 마우스로 드래그하여 타임라인의 가장 상단 빈 공간(일반 비디오 트랙보다 위쪽 영역)으로 가져갑니다.
  3. 마우스 드롭과 동시에 타임라인에 Subtitle 1이라는 이름의 전용 자막 트랙이 자동으로 생성되며, 텍스트 블록들이 고유의 타임코드에 맞춰 배열됩니다.
  4. 주의 사항: 유튜브에서 추출한 자막은 대개 영상의 절대 시작 시간인 00:00:00:00을 기준으로 제작됩니다. 따라서 타임라인 플레이헤드(재생 바)를 맨 앞으로 이동시킨 뒤, 자막 트랙의 첫 번째 블록 시작점을 정확히 일치시켜 배치해야 전체적인 싱크 오차를 줄일 수 있습니다.

3. 자막 싱크(Sync) 불일치 원인과 유형별 해결책

SRT 자막을 정상적으로 타임라인에 올렸음에도 불구하고 오디오와 자막의 싱크가 맞지 않는 현상이 종종 발생합니다. 이는 시스템 오류가 아니라 포맷 변환과 타임코드 해석의 차이에서 오는 기술적 문제입니다. 세 가지 주요 원인과 해결 방법을 제시합니다.

유형 1: 자막 전체가 일정 시간만큼 일정하게 밀리거나 당겨진 경우

영상 시작 부분의 인트로 유무나 컷 편집 차이로 인해 전체 자막이 고르게 뒤처지거나 앞서는 경우입니다.

  • 해결법 (전체 드래그 이동): Subtitle 트랙에 배치된 자막 블록 중 아무거나 하나를 마우스로 클릭한 뒤, 전체 선택 단축키(Ctrl + A 또는 Cmd + A)를 누릅니다. 모든 자막 블록이 빨갛게 활성화되면 마우스로 전체를 통째로 잡아 좌우로 움직이면서 첫 음성 파형과 자막의 시작점을 일치시킵니다.
  • 해결법 (인스펙터 오프셋 조절): 보다 정밀한 프레임 단위의 조정을 원한다면 자막 트랙 전체를 선택한 상태에서 우측 상단의 [Inspector(인스펙터)] ➔ [Track] 탭으로 이동합니다. 하단의 [Offset] 항목에 값을 입력하여 자막 전체의 타이밍을 밀리초(ms) 단위나 프레임 단위로 앞뒤로 미세 조정할 수 있습니다.

유형 2: 뒤로 갈수록 자막 싱크가 점점 벌어지는 경우 (누적 오차)

영상의 초반부에는 자막이 잘 맞다가 5분, 10분 뒤로 갈수록 음성보다 자막이 느려지거나 빨라지는 현상입니다. 이는 100% 영상 소스와 타임라인의 프레임 레이트(FPS, Frame Rate) 불일치 때문에 발생합니다.

유튜브 영상은 주로 29.97fps(Drop Frame 또는 Non-Drop Frame) 혹은 30fps, 60fps 등 다양한 프레임 규격을 사용합니다. 다빈치 리졸브 타임라인의 기본 설정값이 원본 SRT 자막이 생성될 당시의 기준 프레임 레이트와 다르면 타임코드를 계산하는 속도에 미세한 차이가 쌓여 뒤로 갈수록 제어가 불가능할 정도로 싱크가 벌어집니다.

  • 해결법 (타임라인 프레임 레이트 재설정):
    1. 현재 작업 중인 타임라인의 비디오 프레임 레이트를 확인합니다. 미디어 풀에서 비디오 소스를 우클릭하고 [Attributes...]를 누르면 원래의 FPS를 알 수 있습니다.
    2. 다빈치 리졸브는 한 번 생성된 타임라인 내에서는 프레임 레이트를 중간에 강제로 변경할 수 없는 구조적 특성을 가집니다.
    3. 따라서 싱크 누적 오차를 해결하려면 미디어 풀 빈 곳을 우클릭하고 [Timelines] ➔ [Create New Timeline...]을 선택합니다.
    4. 새 타임라인 설정 창 하단의 [Use Project Settings] 체크를 해제하고 [Format] 탭으로 들어갑니다.
    5. [Timeline Frame Rate] 항목을 확인한 원본 영상의 정확한 소수점 프레임(예: 29.97 또는 23.976)에 일치하도록 변경한 뒤 새 타임라인을 생성합니다.
    6. 새롭게 열린 타임라인 위에 영상과 SRT 자막 파일을 다시 가져와 배치하면, 타임코드 동기화 알고리즘이 정상 작동하여 누적 오차 없이 완벽하게 싱크가 유지됩니다.

유형 3: 특정 구간만 싱크가 맞지 않는 경우

유튜브 자동 자막 기능을 썼거나 중간에 편집이 가해진 영상의 경우, 특정 대화 구간만 자막이 길게 늘어지거나 타이밍이 어긋날 수 있습니다.

  • 해결법 (개별 컷 및 텍스트 편집): 다빈치 리졸브의 자막 트랙은 일반 비디오 클립처럼 컷 페이지나 에디트 페이지에서 단축키(Ctrl + B 또는 Cmd + B)를 이용해 자막 블록을 자를 수 있습니다. 싱크가 맞지 않는 특정 블록을 반으로 쪼갠 뒤 마우스로 끝부분을 늘리거나 줄여 개별 자막의 지속 시간(Duration)을 오디오 파형에 일치시킵니다.

4. 다빈치 리졸브 자막 스타일 및 폰트 커스터마이징

타임라인에 자막 싱크를 완벽하게 맞추었다면, 시청 가독성을 높이기 위해 디자인을 다듬어야 합니다. 다빈치 리졸브의 서브타이틀 인스펙터 시스템은 한 번의 설정으로 트랙 전체 자막의 디자인을 일괄 변경할 수 있는 효율적인 기능을 제공합니다.

1) 스타일 일괄 템플릿 적용 방법

  1. 타임라인의 Subtitle 트랙에 배치된 자막 블록 중 아무거나 하나를 선택합니다.
  2. 우측 상단의 [Inspector] ➔ [Caption] 탭에서는 개별 텍스트 내용을 수정할 수 있으며, 디자인 변경을 위해서는 그 옆의 [Style] 탭을 클릭해야 합니다.
  3. [Style] 탭 내의 모든 옵션은 기본적으로 '트랙 전체 일괄 적용'을 원칙으로 하므로, 여기서 변경하는 디자인 요소는 타임라인 안의 모든 자막에 동일하게 반영됩니다.

2) 핵심 가독성 설정 옵션 가이드

설정 항목 권장 조절 값 및 효과 목적
Font (폰트) 프리텐다드(Pretendard), 에스코어 드림, Gmarket Sans 등 가독성이 높은 고딕 계열 선택 가독성 확보 및 시선 분산 방지
Size (크기) 40 ~ 55 사이 (Full HD 기준, 해상도에 맞춰 상대적 조절) 모바일 시청 환경 대응
Alignment (정렬) 가로 기준 '중앙 정렬', 세로 기준 '하단 정렬' 아이콘 선택 정돈된 화면 구성
Stroke (테두리) [Stroke] 체크 활성화 ➔ Color: 검은색 ➔ Size: 3 ~ 5 사이로 조절 밝은 배경에서 자막 분리
Drop Shadow (음영) [Drop Shadow] 체크 활성화 ➔ Offset 값과 Blur 값을 조절하여 은은한 그림자 생성 입체감 부여 및 고급스러운 연출
Background (배경 박스) [Background] 체크 활성화 ➔ Color: 반투명 검은색 ➔ Height/Width 조절 예능 자막 스타일 및 정보 전달력 극대화

5. 최종 결과물 자막 수출 및 렌더링(Export) 설정

디자인과 싱크 작업이 모두 끝났다면 영상을 파일로 출력해야 합니다. 다빈치 리졸브에서 자막을 포함하여 출력할 때는 비디오 화면 자체에 자막을 완전히 구워버리는 방식(Burn-in)과 자막 파일을 별도로 출력하는 방식(As a separate file) 중 선택할 수 있습니다.

  1. 하단 메인 탭 메뉴에서 가장 오른쪽에 있는 로켓 모양 아이콘인 [Deliver (딜리버 페이지)]로 이동합니다.
  2. 왼쪽 상단의 [Render Settings (렌더 설정)] 창에서 파일 이름, 저장 경로, 비디오 포맷(MP4, QuickTime 등) 및 코덱(H.264, H.265)을 지정합니다.
  3. 설정 목록을 아래로 스크롤하여 맨 하단에 위치한 [Subtitle Settings (자막 설정)] 메뉴를 찾아 확장합니다.
  4. [Export Subtitle] 체크박스를 반드시 활성화합니다.
  5. Format 옵션 선택:
    • Burn into video (권장): 자막을 영상 이미지 자체에 픽셀로 인쇄하여 내보내는 방식입니다. 시청자가 어떤 디바이스나 플레이어로 영상을 보더라도 글꼴과 스타일이 동일하게 유지되므로 일반적인 유튜브 최종본 출력 시 가장 안전합니다.
    • As a separate file: 영상 파일과는 별개로 새로운 .srt 또는 .vtt 자막 파일만 따로 생성합니다. 유튜브 플랫폼에 자막 파일을 따로 업로드하여 켜고 끌 수 있는 폐쇄 자막(CC) 형태로 서비스할 때 사용합니다.
  6. 설정을 마친 후 하단의 [Add to Render Queue]를 누르고, 우측 렌더 큐 창에서 [Render All] 버튼을 클릭하여 최종 인코딩을 완료합니다.

6. 효율적인 자막 작업을 위한 실무 팁 총정리

  • 타임라인 FPS 조기 확정: 프로젝트를 생성하자마자 첫 비디오 클립을 올릴 때 프레임 레이트를 원본 소스와 무조건 일치시키십시오. 이 첫 단추가 잘못 끼워지면 SRT 임포트 시 싱크 누적 오차를 잡기 위해 타임라인을 새로 파야 하는 번거로움이 생깁니다.
  • 텍스트 가독성 영역 보호: 자막 레이어 하단에 인스펙터의 Background 기능을 활용해 투명도 40~50%의 검은색 바를 살짝 깔아두면 배경 영상이 아무리 밝거나 복잡해도 글자가 묻히지 않습니다.
  • 오디오 파형 크기 키우기: 에디트 페이지 타임라인 옵션에서 오디오 트랙의 높이를 키우고 파형(Waveform)을 시각적으로 뚜렷하게 키워두면, 자막 블록의 시작점과 끝점을 칼같이 맞추는 컷 편집 작업 속도가 배로 빨라집니다.