자동 더킹
음성이 감지된 구간에서 배경음악을 자동으로 -12 dB 낮춰 또렷한 내레이션을 만듭니다.
자동 더킹이란
더킹(ducking)은 라디오 방송에서 DJ가 말할 때 배경음악을 잠시 줄이던 기술입니다. Bom 영상 편집기는 whisper.cpp의 VAD(Voice Activity Detection)로 음성 구간을 자동 검출해 배경음악 볼륨을 sidechain compressor로 낮춥니다.
- 수동으로 키프레임을 찍지 않아도 됩니다.
- 여러 음성 트랙이 있어도 각각 처리합니다.
- 검출 결과는 시각적 envelope 곡선으로 확인할 수 있습니다.
켜기 / 끄기
- 배경음악 트랙을 선택합니다.
- 우측 인스펙터에서 "Auto-Ducking" 토글을 켭니다.
- "Source" 드롭다운에서 음성 트랙을 지정합니다 (기본: 모든 음성 트랙).
글로벌 기본값
Settings → 영상 편집기에서 새 프로젝트의 자동 더킹 기본 ON/OFF를 설정할 수 있습니다.
파라미터
- Threshold (기본 -30 dB) — 음성으로 간주할 최저 볼륨
- Attack (기본 50 ms) — 음성 시작 시 볼륨이 낮아지는 속도
- Release (기본 250 ms) — 음성이 끝난 뒤 볼륨이 복귀하는 속도
- Reduction (기본 -12 dB) — 얼마나 낮출지
- Hold (기본 200 ms) — 음성 사이 짧은 침묵을 무시할 시간
권장값
내레이션 다큐: Reduction -10 dB / Release 400 ms. 빠른 토크쇼: Reduction -15 dB / Release 150 ms.
수동 조정
자동 더킹 envelope을 그대로 두지 않고 특정 구간만 끄거나 강도를 바꾸고 싶다면, 우클릭 → "키프레임으로 변환"을 선택하세요. 자동 곡선이 수동 키프레임으로 변환되어 자유롭게 편집할 수 있습니다.
한계와 주의사항
- 잡음(에어컨 소음, 도로 소음)을 음성으로 오인할 수 있습니다. Threshold를 높이세요.
- 노래 가사도 음성으로 검출됩니다. 노래 위에 BGM을 깔 때는 자동 더킹을 끄세요.
- 300 ms 미만의 짧은 호흡·필러는 무시됩니다.
- 오디오 트랙 샘플레이트가 16 kHz 이하면 검출 정확도가 떨어집니다.