본문 바로가기

data4

결과가 이상하다면 예민하게 원인을 분석하자 오늘은 굉장히 자존심이 상했던 학부연구생 프로그램의 final project에 대해서 리뷰하고자 한다. 이 프로젝트는 한 학기동안 음성인식에 대한 공부를 함께 하고 학부생 수준에 맞게 연구실 선배가 만든 프로젝트로, colab을 사용해 구현한 python 음성인식 코드에 한 오류를 고치는 과제였다. 나는 나름 석사생인데 학부생의 프로젝트를 완벽하게 하고 싶었던 나는 조금 긴장했었지만, 코드를 훑어보니 이상한 부분을 쉽게 찾아낼 수 있었다. token설정 부분이었다. 간단하다고 생각하며 바로 수정해주었다. 하지면 부끄럽게도 정답은 그게 아니였다. 먼저 저 부분이 정답이 아닌 이유는 아래와 같다. dataset and model Initialization 하는 단계를 보면 아래와 같은 코드가 있다. 해당 코.. 2022. 7. 15.
데이터 전처리 중 오류들 오늘은 새로운 서버에서 새로운 데이터로 코드를 돌리기로 했다. 어제부터 시작하여 데이터는 모두 준비 되었고 디렉토리를 알맞게 변경하고 코드를 돌렸다. 그런데 몇가지 문제 때문에 시간이 좀 걸렸다. 1. sudo 권한 데이터가 다른 디스크에 들어가 있어서 sudo 권한을 줬다. 2. 한글 인코딩 File "all_csv.py", line 29 SyntaxError: Non-ASCII character 'xeb' in file all_csv.py on line 29, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details 이런 오류가 떠서 검색해보니 한국어 오류라고 한다. # -*- coding: utf-8 -*- 을 문서.. 2022. 4. 23.
[Error해결]unexpected end of file 아래와 같은 오류가 뜬다면 원본파일에 결함이 있어서 제대로 압축을 풀지 못한다는 뜻이다. 데이터를 다시 받아서 제대로 된 압축을 풀어보자 unexpected end of file 2021. 12. 12.
2021 AI 데이터 해커톤 대회 연구실에서의 첫 대회. 선배의 제안으로 함께 하게 되었다. 음성 관련 AI는 처음 다루는 것이지만 선배 믿고 도전하기로 했다. 특징은 대회 일정이 굉장히 타이트하다는 것이다. 인공합성 음성 제작은 심사가 까다로울 것 같은데 MOS(Mean Opinion Score) Test를 통해 진행한다고 한다. 우리는 3번 한국어 아동 음성 데이터와 6번 감성 및 발화 스타일별 음성합성 데이터 부문에 참가하기로 했다. 그렇지만 3번을 메인으로, 6번을 서브로 진행할 것이다. 2021. 12. 12.
반응형