Video
-
Google AI Blog(논문) 리뷰: SoundStream (An End-to-End Neural Audio Codec)최신 기술동향/인공지능 (AI) 2021. 8. 14. 11:24
AI에 대해 독보적인 기술력을 갖고있는 Google은 AI을 이용한 다양한 자사의 연구내용을 소개하는 Google AI Blog [1]를 운영한다. 이번 글에서는 Google AI Blog에 올라온 기술 중에 가장 최신인 Neural Network (NN)를 이용한 Audio Codec에 대해 분석하고 소개하고자 한다. 기술에 대한 원문은 논문 [2]으로도 공개가 되어 arxiv에 올라와 있다. Codec은 보통 Encoding / Decoding을 합친 표현으로 송신단에서 데이터를 압축하여 전송하고, 수신단에서 압축된 데이터를 통해 원래 데이터로 복구하는 프로토콜이다. 즉, 무선이든 유선이든 특정 네트워크를 통과해서 전달이 되어야하기 때문에 Multi-user가 해당 네트워크를 공유하는 상황에서는 적은..
-
Video Coding for Machine (VCM) 논문 리뷰최신 기술동향 2021. 7. 13. 18:08
이번에 리뷰할 기술은 Video Coding for Machine (VCM)이다. 일반적으로, 이미지를 압축한다고 할 때는 JPEG, 영상을 압축한다고 할 때는 H.264 등의 압축 표준을 사용한다. 전통적인 압축의 방식은, 어느 정도 데이터(e.g., 이미지, 영상)가 뭉개져 보이는 형태더라도, 사람이 보기 쉽게 Encoding이 된다. 예를 들면, JPEG으로 압축된 데이터를 사람이 본다고 했을 때, 비행기인지, 새인지 판단할 수 있다. 이런 기존의 압축 방법 덕분에, 우리는 몇십 MB에 달하는 이미지 한 장, 몇십 GB에 달하는 영상 하나를 수십 배까지 용량을 줄여서 전송할 수 있었고, 이렇게 압축된 데이터가 다양한 use case에 적용되었다. 하지만, 클라우드 컴퓨팅을 위해 해당 데이터를 전송해..