Computer Vision💖/Video
![[TIL] Video Diffusion Model과 시뮬레이터](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fcoajsm%2FbtsJE0CC0dh%2Fs4AvKfEGUEXqjEeCEUptJ0%2Fimg.png)
[TIL] Video Diffusion Model과 시뮬레이터
오늘의 세미나 주제는 .. Video Diffusion model이 real world의 dynamics를 반영할 수 있는 시뮬레이터로서 기능할 수 있을지이다. ☑️ Learning Interactive Real-World Simulators (Jan 2024) - ICLR24 Outstanding paperGood world simulator가 있다면, human은 diverse scene에 대해 더 많은 interaction이 가능할 것 We explore the possibility of learning a universal simulator of real-world interaction through generative modeling.이 paper에서는 action-in-video-out con..
![[TIL] Long Video Understanding](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbQe3A5%2FbtsJsmevcnR%2FPCrH1vp0X90WkJivpy6Zs0%2Fimg.png)
[TIL] Long Video Understanding
Recent Trend in Long Video Understanding Content LLM context length Compress visual tokens with streaming models ☑️ Long Context Transfer from Laugnage to Vision (Jul 2024) Background Video data는 너무 densy + lengthy 하고, (보통 8/32 frame 단위로 sampling해서 진행한다) high-quality long video pretraining dataset이 아직 없다. (커뮤니티의 문제) Idea Longer text data로 train해서 context length를 늘린다 Context-extended LM을 이용해 lo..