본문 바로가기

전체 글103

[NVIDIA omniverse] Windows에서 엔비디아 옴니버스 사용하기 안녕하세요 여러분 import ysy입니다. 오늘은 NVIDIA의 omniverse라는 툴을 사용해보겠습니다. omniverse란?옴니버스는 여러 앱을 넘나들며 사용 가능한 툴USD file typesUniversal scene descriptor format마야, 블렌더 등 여러 엔진을 넘나듦fbx file —> usd format새로운 씬을 만든다고 볼 수 있음렌더링 퀄리티 굳Suite of toolsAudio2face을 포함함 설치설치할게요쿠키설정은 알아서 해주시고 새로운 창이 뜨는데 스크롤 다운 해서 아래 화면의 'Download Omniverse Kit SDK' for 뒤에 있 'Windows'를 누른다.그러면 이 화면이 뜨는데 여기서 'Download' 버튼을 누른다. 버튼이 없으면 옴니버스 .. 2025. 1. 21.
언어모델 LM의 역사 정리 안녕하세요 import ysy입니다.제가 너무 오래 모델을 안만졌더니 서로 개념이 헷갈리길래 이번에 한 번에 쫙 정리해봤습니다.도움이 됐으면 좋겠어요.언어모델(Language Model, LM)을 공부하는 이유LM은 단어의 나열 확률을 계산해주는 모델입니다. 단어 나열 확률을 바탕으로 가장 높은 확률을 가지는 최적의 단어를 선택(생성)합니다.이 단어들은 모여 문장이, 문장이 모여 문단이 됩니다. GAN(Generative Adversarial Neural Network)이 이미지 데이터 뿐만 아니라 여러 데이터에 적용이 되듯이시퀀스 예측 모델(LM)을 통해 여러 task를 처리할 수 있습니다. 1. Word2Vec (2013)one-hot encoding, uni-gram, N-gram 등 확률분포에서 .. 2024. 11. 10.
What is Ramp? Hello everyone! This is import ysy!Today I want to share the concept of RAMP! Let's dive in! The concept of a ramp in digital signal processing (DSP), and more broadly in mathematics, refers to a function or sequence of values that gradually changes over a specific range. In DSP, ramps are typically used to smoothly transition values, such as audio amplitudes or signal strengths, over time. Here.. 2024. 10. 10.
[논문 추천]Applications and Advances of Artificial Intelligence in Music Generation:A Review 안녕하세요 여러분, import ysy입니다. 오늘은 괜찮은 리뷰논문 소개하려고 합니다.Gene AI쪽이 뜨겁다는 건 알고 있지만 저도 요새 논문을 통 안읽어서 놓친 동향 공부한다 생각하고 읽었습니다.AI 음악 생성 분야의 최근 발전을 종합적으로 다루는 리뷰 논문입니다.AI 음악 생성의 역사, 주요 모델, 현재 응용되는 분야, 미래에 주목받을 주제들에 관해 이야기합니다.GAN, 트랜스포머, 변이형 오토인코더(VAE), Diffusion Model 등 다양한 모델들이 비교되어 있으며,각 모델의 장단점이 정리되어 있습니다. 논문에서는 생성된 음악의 창의성과 다양성 향상, 복잡한 구조와 긴 시간 의존성을 더 잘 처리하는 모델 개발, 표준화된 평가 방법 구축 등이 필요하다고 제시합니다. 여러 모델을 비교하면서 .. 2024. 10. 10.
Weights and Biases(W&B), wandb 소개 안녕하세요, import ysy입니다. Weights and Biases(W&B), 흔히 wandb라고 부르는 머신러닝 및 딥러닝 프로젝트 분석 도구에 대해 소개드립니다. W&B의 장점 중 하나는 아래와 같이 시각화가 매우 깔끔하게 이루어진다는 점입니다. 아래 이미지는 학습 중 반드시 확인해야 하는 learning rate와 loss 값을 받아와 이를 시각화한 것입니다. 매 스텝마다 각 값을 받아와 그래프를 평탄화하여 학습의 진행 상태를 한눈에 확인할 수 있습니다. 이 그래프를 통해 학습이 잘 진행되고 있는지를 쉽게 판단할 수 있습니다. 또한, 동일한 프롬프트에 대해 학습이 진행됨에 따라 결과가 어떻게 변하는지도 직관적으로 확인할 수 있습니다. 아래 두 이미지는 스펙트로그램과 관련된 것으로, 음악 파일의.. 2024. 10. 8.
Stable Audio Open finetuning 파인튜닝 / 코드 공유 안녕하세요 import ysy입니다. 올 여름 Stability AI에서 Stable Audio Open논문을 공개하며상남자답게 모든 학습 방법을 공개했죠? 논문에서도 느껴지듯 모든 것을 오픈해서consumer-grade GPU로 밑바닥부터 학습이 가능합니다. 저도 처음부터 학습을 해봤는데 엔간치 돌려서는 노이즈만 나오긴 합니다. 그래서 오늘은파인튜닝 진행해보겠습니다.  제가 사용한 환경 정보모든 작업은 vscode에서 진행했습니다.ssh를 사용해서 A100 gpu가 하나 있는 리눅스 서버 사용했습니다.  제가 사용한 데이터데이터는 80분 짜리 레게 데이터 사용했습니다.저는 파인튜닝 되는 것만 확인하려고특징이 두드러지는 레게 장르로 적은 데이터만 사용했습니다. 일부러 과적합보려고 한거긴 한데 그래도 너무.. 2024. 8. 29.
반응형