분류 전체보기17 vscode black 자동 포매팅 설정 python 스크립트 작성 후 가독성을 위해 black을 이용하여 formatting을 하는 경우가 많은데, 깜빡하는 경우 보기 안좋은 코드가 깃허브에 그대로 올라가게 된다... (안그래도 부끄러운 코드가 더 부끄러워지게 된다...) 이런 불상사를 방지하기 위해, vscode에서 python 파일을 수정하는 경우 파일이 저장될 때 자동으로 black이 적용되도록 설정해주는 것이 좋다. * 참고 : black https://black.readthedocs.io/en/stable/ Black 24.2.0 documentation Next The Black Code Style black.readthedocs.io 1. vscode extension에서 Black Formatter를 설치한다. 확장 -> Bla.. 2024. 2. 22. 웨이브(.wav) 파일 헤더 분석 wav 파일을 바이트로 읽었을 때 처음 시작하는 44바이트 파일 헤더에 해당한다. 아래는 내가 갖고 있는 임의의 wav파일의 헤더이다. b'RIFF$`\x01\x00WAVEfmt \x10\x00\x00\x00\x01\x00\x01\x00\x80\xbb\x00\x00\x00w\x01\x00\x02\x00\x10\x00data\x00`\x01\x00' 44바이트의 헤더는 크게 3개의 chunk(파일 형식 chunk + 음성 정보 chunk + 데이터 chunk)로 나뉜다. 특히 해당 오디오 데이터를 다룰 때는 samplerate, byterate, channel 등의 정보를 담고 있는 중간 chunk의 내용이 중요하다. 위의 헤더 예시에서 각 byte가 무엇을 의미하는지 아래 간단히 정리하였다. * 주의할 .. 2024. 2. 14. 허깅페이스에 오디오 데이터셋 업로드하기 1. 기본 먼저 가장 기본적인 구조로 오디오 데이터셋을 구성해보자. train, test, validation은 분리되지 않고, 모든 데이터가 train에 할당된다. 폴더 구조는 아래와 같다. 기본 경로(예시에서는 my_audio_dataset)에 metadata.csv 파일이 있으며 되며, 오디오 파일들은 data_dir 의 data 디렉토리에 위치해있으면 된다. (오디오 파일들이 반드시 data 디렉토리에 위치해있지 않아도 된다. metadata.csv에서 각 오디오 파일 경로만 잘 적혀 있으면 된다.) my_audio_dataset/ + metadata.csv + data/ + 000000001.wav + 000000002.wav + 000000003.wav + ... metadata.csv 는 아.. 2024. 1. 5. python으로 파일(폴더) 이동, 복사, 삭제 등 파이썬 기본 내장 모듈인 shutil 을 이용하면 된다 1. 파일 이동 import shutil src_file_path = "data/aaa.txt" dst_file_path = "tratin/data/bbb.txt" shutil.move(src_file_path, dst_file_path) 2. 파일 복사 import shutil src_file_path = "data/aaa.txt" dst_file_path = "train/data/bbb.txt" src_dir = "data/" dst_dir = "train/data/" # 복사되는 파일의 이름을 지정하는 경우 shutil.copyfile(src_file_path, dst_file_path) # 파일을 특정 디렉토리로 복사 # 파일의 내용 복사 s.. 2024. 1. 5. 이전 1 2 3 4 5 다음