ML2 웨이브(.wav) 파일 헤더 분석 wav 파일을 바이트로 읽었을 때 처음 시작하는 44바이트 파일 헤더에 해당한다. 아래는 내가 갖고 있는 임의의 wav파일의 헤더이다. b'RIFF$`\x01\x00WAVEfmt \x10\x00\x00\x00\x01\x00\x01\x00\x80\xbb\x00\x00\x00w\x01\x00\x02\x00\x10\x00data\x00`\x01\x00' 44바이트의 헤더는 크게 3개의 chunk(파일 형식 chunk + 음성 정보 chunk + 데이터 chunk)로 나뉜다. 특히 해당 오디오 데이터를 다룰 때는 samplerate, byterate, channel 등의 정보를 담고 있는 중간 chunk의 내용이 중요하다. 위의 헤더 예시에서 각 byte가 무엇을 의미하는지 아래 간단히 정리하였다. * 주의할 .. 2024. 2. 14. 허깅페이스에 오디오 데이터셋 업로드하기 1. 기본 먼저 가장 기본적인 구조로 오디오 데이터셋을 구성해보자. train, test, validation은 분리되지 않고, 모든 데이터가 train에 할당된다. 폴더 구조는 아래와 같다. 기본 경로(예시에서는 my_audio_dataset)에 metadata.csv 파일이 있으며 되며, 오디오 파일들은 data_dir 의 data 디렉토리에 위치해있으면 된다. (오디오 파일들이 반드시 data 디렉토리에 위치해있지 않아도 된다. metadata.csv에서 각 오디오 파일 경로만 잘 적혀 있으면 된다.) my_audio_dataset/ + metadata.csv + data/ + 000000001.wav + 000000002.wav + 000000003.wav + ... metadata.csv 는 아.. 2024. 1. 5. 이전 1 다음