본문으로 이동

비디오포엣

위키백과, 우리 모두의 백과사전.
비디오포엣
개발자구글
발표일2024년 2월 8일(20개월 전)(2024-02-08)
종류대형 언어 모델

비디오포엣(VideoPoet)은 구글 리서치에서 2023년 비디오 제작을 위해 개발한 대형 언어 모델이다.[1][2][3][4] 정지 이미지를 애니메이션화하도록 요청할 수 있다.[5] 이 모델은 텍스트, 이미지, 비디오를 입력으로 받아들이며, 모든 입력에 대해 모든 형식으로 생성된 콘텐츠에 기능을 추가하는 프로그램을 포함한다.[4] 비디오포엣은 2023년 12월 19일에 공식 발표되었다.[1] 이 모델은 자기회귀 언어 모델을 사용한다.

각주

[편집]
  1. Krithika, K. L. (2023년 12월 20일). “Google Unveils VideoPoet, a New LLM for Video Generation” (미국 영어). 《Analytics India Magazine》. 2024년 4월 29일에 확인함. 
  2. Kondratyuk, Dan; Yu, Lijun; Gu, Xiuye; Lezama, José; Huang, Jonathan; Hornung, Rachel; Adam, Hartwig; Akbari, Hassan; Alon, Yair; Birodkar, Vighnesh; Cheng, Yong; Chiu, Ming-Chang; Dillon, Josh; Essa, Irfan; Gupta, Agrim; Hahn, Meera; Hauth, Anja; Hendon, David; Martinez, Alonso; Minnen, David; Ross, David; Schindler, Grant; Sirotenko, Mikhail; Sohn, Kihyuk; Somandepalli, Krishna; Wang, Huisheng; Yan, Jimmy; Yang, Ming-Hsuan; Yang, Xuan; Seybold, Bryan; Jiang, Lu (2023년 12월 21일). “VideoPoet: A Large Language Model for Zero-Shot Video Generation”. arXiv:2312.14125 [cs.CV]. 
  3. “Google has introduced VideoPOET breaking new ground in coherent video generation”. 《Gizmochina》. 2023년 12월 21일. 
  4. “VideoPoet” (영어). 《Google Research》. 2024년 4월 29일에 확인함. 
  5. Franzen, Carl (2023년 12월 20일). “Google's new multimodal AI video generator VideoPoet looks incredible”. 《VentureBeat》. 

외부 링크

[편집]
  • 위키미디어 공용에 비디오포엣 관련 미디어 분류가 있습니다.