비디오포엣

비디오포엣
	"영화관에서 팝콘을 먹는 개" "모자, 선글라스, 가죽 재킷을 입고 드럼을 연주하는 테디베어" 텍스트에서 모델이 생성한 예시 영상
개발자	구글
발표일	2024년 2월 8일(20개월 전)
종류	대형 언어 모델

비디오포엣(VideoPoet)은 구글 리서치에서 2023년 비디오 제작을 위해 개발한 대형 언어 모델이다.^[1]^[2]^[3]^[4] 정지 이미지를 애니메이션화하도록 요청할 수 있다.^[5] 이 모델은 텍스트, 이미지, 비디오를 입력으로 받아들이며, 모든 입력에 대해 모든 형식으로 생성된 콘텐츠에 기능을 추가하는 프로그램을 포함한다.^[4] 비디오포엣은 2023년 12월 19일에 공식 발표되었다.^[1] 이 모델은 자기회귀 언어 모델을 사용한다.

각주

↑ ^가 ^나 Krithika, K. L. (2023년 12월 20일). “Google Unveils VideoPoet, a New LLM for Video Generation” (미국 영어). 《Analytics India Magazine》. 2024년 4월 29일에 확인함.
↑ Kondratyuk, Dan; Yu, Lijun; Gu, Xiuye; Lezama, José; Huang, Jonathan; Hornung, Rachel; Adam, Hartwig; Akbari, Hassan; Alon, Yair; Birodkar, Vighnesh; Cheng, Yong; Chiu, Ming-Chang; Dillon, Josh; Essa, Irfan; Gupta, Agrim; Hahn, Meera; Hauth, Anja; Hendon, David; Martinez, Alonso; Minnen, David; Ross, David; Schindler, Grant; Sirotenko, Mikhail; Sohn, Kihyuk; Somandepalli, Krishna; Wang, Huisheng; Yan, Jimmy; Yang, Ming-Hsuan; Yang, Xuan; Seybold, Bryan; Jiang, Lu (2023년 12월 21일). “VideoPoet: A Large Language Model for Zero-Shot Video Generation”. arXiv:2312.14125 [cs.CV].
↑ “Google has introduced VideoPOET breaking new ground in coherent video generation”. 《Gizmochina》. 2023년 12월 21일.
↑ ^가 ^나 “VideoPoet” (영어). 《Google Research》. 2024년 4월 29일에 확인함.
↑ Franzen, Carl (2023년 12월 20일). “Google's new multimodal AI video generator VideoPoet looks incredible”. 《VentureBeat》.

외부 링크

위키미디어 공용에 비디오포엣 관련 미디어 분류가 있습니다.

[:1-1] 가 ^나 Krithika, K. L. (2023년 12월 20일). “Google Unveils VideoPoet, a New LLM for Video Generation” (미국 영어). 《Analytics India Magazine》. 2024년 4월 29일에 확인함.

[2] Kondratyuk, Dan; Yu, Lijun; Gu, Xiuye; Lezama, José; Huang, Jonathan; Hornung, Rachel; Adam, Hartwig; Akbari, Hassan; Alon, Yair; Birodkar, Vighnesh; Cheng, Yong; Chiu, Ming-Chang; Dillon, Josh; Essa, Irfan; Gupta, Agrim; Hahn, Meera; Hauth, Anja; Hendon, David; Martinez, Alonso; Minnen, David; Ross, David; Schindler, Grant; Sirotenko, Mikhail; Sohn, Kihyuk; Somandepalli, Krishna; Wang, Huisheng; Yan, Jimmy; Yang, Ming-Hsuan; Yang, Xuan; Seybold, Bryan; Jiang, Lu (2023년 12월 21일). “VideoPoet: A Large Language Model for Zero-Shot Video Generation”. arXiv:2312.14125 [cs.CV].

[3] “Google has introduced VideoPOET breaking new ground in coherent video generation”. 《Gizmochina》. 2023년 12월 21일.

[:0-4] 가 ^나 “VideoPoet” (영어). 《Google Research》. 2024년 4월 29일에 확인함.

[5] Franzen, Carl (2023년 12월 20일). “Google's new multimodal AI video generator VideoPoet looks incredible”. 《VentureBeat》.

[1]

[2]

[3]

[4]

[5]