https://aihub.or.kr/aidata/30705
자유대화 음성(소아, 유아)
한국인 중 소아남녀의 음성을 문자로 바꾸어 주고, 문맥을 이해하는 한국어 음성언어처리 기술 개발을 위한 한국어 음성 데이터
aihub.or.kr
위 주소에서 필요한 data를 보충하기로 했다.
우리 대회는 8살부터 13살까지의 초등생 대상 data를 사용하는데,
AI Hub는 10살 이전과 이후로 나뉘기 때문에 두 부분에서 해당하는 data만 뽑아 사용하기로 했다.
문제는, 10살 이전 유아 데이터는 대회에서 제공한 데이터와 비슷한 양으로 충분하지만,
'일반남녀' 카테고리에서 뽑은 11살부터 13살까지 대상의 데이터가 터무니 없이 적었다.
이대로라면 데이터 불균형이 너무 심해질 것 같았다.
그리고 우리가 내린 대안은 30대 여성의 음성까지는 포함하자는 것이었다.
여성의 경우 음역대가 높아 약간의 오차는 있겠지만 비슷한 결과를 얻을 수 있을 것이라고 생각했다.
개인적으로, 유아의 음성이 발음이 새거나 잘못된 발음을 하는 등의 문제를 많이 볼 수 있었는데,
30대 여성의 음성까지 포함하면 정확도가 올라갈 것을 기대했다.
그래서 우리가 사용한 데이터는 총 세 가지다.
1. 대회측에서 제공한 8살부터 13살까지의 데이터
2. AI Hub 유아 음성의 8살부터 10살까지의 데이터
3. AI Hub 일반 남녀 음성의 10살부터 13살, 그리고 13살부터 39살까지의 여성의 음성 데이터
그리고 대회 측에서 따로 baseline을 주지 않아서 코드는 Naver Clova의 github코드를 참고하기로 했다.
https://github.com/clovaai/ClovaCall
GitHub - clovaai/ClovaCall: ClovaCall dataset and Pytorch LAS baseline code (Interspeech 2020)
ClovaCall dataset and Pytorch LAS baseline code (Interspeech 2020) - GitHub - clovaai/ClovaCall: ClovaCall dataset and Pytorch LAS baseline code (Interspeech 2020)
github.com
'추가 활동' 카테고리의 다른 글
[교육] RC CAR 자율주행 교육 프로그램 (0) | 2021.12.31 |
---|---|
[대회] 2021 AI 데이터 해커톤 대회 타임라인식 보고서 3 (0) | 2021.12.16 |
2021 AI 데이터 해커톤 대회 타임라인식 보고서 2 (2) | 2021.12.13 |
[대회] 2021 AI 데이터 해커톤 대회 타임라인식 보고서 (0) | 2021.12.12 |
2021 AI 데이터 해커톤 대회 (0) | 2021.12.12 |
댓글