반응형 개발92 [논문 리뷰] Everybody Dance Now 오늘은 비디오 합성 분야의 논문인 Everybody Dance Now에 대해 리뷰를 해보겠습니다. 비디오 합성은 처음이라 조금 복잡한 내용이 많을 줄 알았는데 아주 간단하게 기존의 모델을 사용한 논문이라 이해하기가 쉬웠습니다.ㅎㅎ 실제 demo영상도 보니 간단한 모델에 비해 성능이 대단한 것을 확인할 수 있었습니다. www.youtube.com/watch?v=PCBTZh41Ris Abstract 이 논문은 "do as I do"라는 motion transfer방법에 대해 다룬다. 간단하게 flow를 설명하자면 source subject(ex. 발레리나 비디오)로부터 포즈를 뽑아내고 학습을 통해 이러한 포즈를 target subject로 매핑시키는 방법이다. Introduction 위와 같이 발레리나의 비.. 2021. 4. 28. Text Classification에서 class imbalance 해결 방법 텍스트 분류를 BERT와 같은 언어모델로 풀고자 할 때 흔하게 발생하는 이슈는 특정 클래스들의 데이터 수가 상대적으로 적은 Imbalance 문제이다. 이를 어떤 방법으로 해결할 수 있을 지 살펴보자. 참고 : www.researchgate.net/publication/336538175_Dealing_with_Data_Imbalance_in_Text_Classification (PDF) Dealing with Data Imbalance in Text Classification PDF | Many real world datasets don’t offer enough training input for regular classifiers: some classes are more represented than .. 2021. 4. 28. [Lecture 5] Backpropagation www.youtube.com/watch?v=lKRatcD9hEg 이번 강의에서는 기본적인 Neural Network의 구조와 파라미터를 업데이트하는 방법인 BACK PROPAGATION에 대해 다룬다. Part 1 파라미터 업데이트 과정을 그레프로 봐보자. 이러한 flow를 생각해볼 때 Loss function은 다음과 같이 정의할 수 있다. 이러한 Loss를 MSE loss라고 한다. 또한, 모델을 Linear regression이라 칭할 수 있다. 이제 하나의 원소가 아닌 벡터단위에서 생각해보자. 여기서 X는 dot product가 된다. 보통 모델에서는 원소단위가 아니라 Matrix, Vector 단위이기에 벡터단위는 앞으로 생략하도록 한다. 다음으로는 Negative log-likelihood l.. 2021. 4. 18. [논문 리뷰] CLIP : Learning Transferable Visual Models From Natural Language Supervision 오늘은 최신 멀티모달 모델인 Open ai의 CLIP에 대해 리뷰를 해보고자 합니다. 공식 홈페이지 : openai.com/blog/clip/ CLIP: Connecting Text and Images We’re introducing a neural network called CLIP which efficiently learns visual concepts from natural language supervision. openai.com 리뷰 작성을 시작하며 멀티모달 카테고리를 하나 만들까 했지만 우선 포스팅의 수가 더 적은 CV에 작성해보기로 했습니다. 이활석님이 텐플코에 올려주신 OpenaiI에서 CLIP관련 분석을 한 게시물도 있으니 참고부탁드립니다. ㅎㅎ https://distill.pub/202.. 2021. 4. 13. 이전 1 ··· 3 4 5 6 7 8 9 ··· 23 다음 728x90 반응형