비디오포엣
보이기
"영화관에서 팝콘을 먹는 개" "모자, 선글라스, 가죽 재킷을 입고 드럼을 연주하는 테디베어" 텍스트에서 모델이 생성한 예시 영상 | |
개발자 | 구글 |
---|---|
발표일 | 2024년 2월 8일 |
종류 | 대형 언어 모델 |
비디오포엣(VideoPoet)은 구글 리서치에서 2023년 비디오 제작을 위해 개발한 대형 언어 모델이다.[1][2][3][4] 정지 이미지를 애니메이션화하도록 요청할 수 있다.[5] 이 모델은 텍스트, 이미지, 비디오를 입력으로 받아들이며, 모든 입력에 대해 모든 형식으로 생성된 콘텐츠에 기능을 추가하는 프로그램을 포함한다.[4] 비디오포엣은 2023년 12월 19일에 공식 발표되었다.[1] 이 모델은 자기회귀 언어 모델을 사용한다.
각주
[편집]- ↑ 가 나 Krithika, K. L. (2023년 12월 20일). “Google Unveils VideoPoet, a New LLM for Video Generation” (미국 영어). 《Analytics India Magazine》. 2024년 4월 29일에 확인함.
- ↑ Kondratyuk, Dan; Yu, Lijun; Gu, Xiuye; Lezama, José; Huang, Jonathan; Hornung, Rachel; Adam, Hartwig; Akbari, Hassan; Alon, Yair; Birodkar, Vighnesh; Cheng, Yong; Chiu, Ming-Chang; Dillon, Josh; Essa, Irfan; Gupta, Agrim; Hahn, Meera; Hauth, Anja; Hendon, David; Martinez, Alonso; Minnen, David; Ross, David; Schindler, Grant; Sirotenko, Mikhail; Sohn, Kihyuk; Somandepalli, Krishna; Wang, Huisheng; Yan, Jimmy; Yang, Ming-Hsuan; Yang, Xuan; Seybold, Bryan; Jiang, Lu (2023년 12월 21일). “VideoPoet: A Large Language Model for Zero-Shot Video Generation”. arXiv:2312.14125 [cs.CV].
- ↑ “Google has introduced VideoPOET breaking new ground in coherent video generation”. 《Gizmochina》. 2023년 12월 21일.
- ↑ 가 나 “VideoPoet” (영어). 《Google Research》. 2024년 4월 29일에 확인함.
- ↑ Franzen, Carl (2023년 12월 20일). “Google's new multimodal AI video generator VideoPoet looks incredible”. 《VentureBeat》.
외부 링크
[편집]위키미디어 공용에 비디오포엣 관련 미디어 분류가 있습니다.