AIHub1 [대회] 2021 AI 데이터 해커톤 대회: 시작 전 목표 설정 https://aihub.or.kr/aidata/30705 자유대화 음성(소아, 유아) 한국인 중 소아남녀의 음성을 문자로 바꾸어 주고, 문맥을 이해하는 한국어 음성언어처리 기술 개발을 위한 한국어 음성 데이터 aihub.or.kr 위 주소에서 필요한 data를 보충하기로 했다. 우리 대회는 8살부터 13살까지의 초등생 대상 data를 사용하는데, AI Hub는 10살 이전과 이후로 나뉘기 때문에 두 부분에서 해당하는 data만 뽑아 사용하기로 했다. 문제는, 10살 이전 유아 데이터는 대회에서 제공한 데이터와 비슷한 양으로 충분하지만, '일반남녀' 카테고리에서 뽑은 11살부터 13살까지 대상의 데이터가 터무니 없이 적었다. 이대로라면 데이터 불균형이 너무 심해질 것 같았다. 그리고 우리가 내린 대안은 .. 2021. 12. 12. 이전 1 다음 반응형