Contents
最近出了一款開源 AI 應用,讓你以後照相的姿勢不對、穿的衣服太長太短、照相時忘了笑都沒關係。 這個開源利用 GAN AI 技術稍微挪點就把照片神奇地轉變了。
這是之前我們寫的一篇是否要用 LLM 開源文章中紐約大學教授曾推薦的 LLM 開源 Bloom 的提供公司 Hugging Face 另一很有趣的 AI 應用 – DragGAN ( 拖動你的 GAN:生成圖像流形上基於點的互動式操作 )
這個開源的概述是 :
合成滿足用戶需求的視覺內容往往需要對生成物件的姿勢、形狀、表情和佈局進行靈活和精確的控制。現有方法通過手動註釋的訓練資料或先前的 3D 模型獲得生成對抗網路 (GAN) 的可控性,這通常缺乏靈活性、精確性和通用性。在這項工作中,我們研究了一種強大但探索較少的控制 GAN 的方法,即以用戶互動的方式“拖動”圖像的任何點以精確到達目標點,如圖 1 所示。為實現這一目標,我們提出了 DragGAN,它由兩個主要部分組成:1) 基於特徵的運動監督,驅動手柄點向目標位置移動,以及 2) 一種新的點跟蹤方法,利用判別生成器特徵來繼續定位手柄點的位置。由 DragGAN,任何人都可以通過精確控制像素的位置對圖像進行變形,從而操縱動物、汽車、人類、風景等不同類別的姿勢、形狀、表情和佈局。由於 GAN 的生成圖像流形( generative image manifold ),即使對於具有挑戰性的場景,例如幻覺遮擋內容和始終遵循物件剛度的變形形狀,它們也傾向於產生逼真的輸出。定性和定量比較都證明了 DragGAN 在圖像處理和點跟蹤任務中優於先前方法的優勢。我們還展示了通過 GAN 反演對真實圖像的處理。


以下是一位 Youtuber 用 DragGAN 的實操介紹,真的很令人驚艷。最後拜登的臉部變化雖然有點讓人覺得怪怪的,但也證實要從沒什麼表情的臉變成笑臉也是沒問題的。 DragGAN 開源程式碼將在六月釋出。對於原理有興趣的人可到 Hugging Face 的 DragGAN 網頁下載 PDF。
也許你會有興趣
- GAN 相關線上課程
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入
❤️您應該有留意到,我們的網頁並不會出現干擾人的跳出煩人的廣告或是在內容中嵌入廣告,因為我們發現這樣對閱讀網頁的內容體驗真的是不好!
如果您覺得我們提供的內容服務還不錯,歡迎透過對以下產品/服務的購買投資來支持本站的營運走得更遠
如果暫時還不需要以下的付費服務,幫我們把這個網站分享給有需要的朋友,您的小小舉動會對 Soft & Share 有莫大的幫助!感謝您的支持!
🎈如果您點選優惠連結後,還是沒有看到優惠價格,請將瀏覽器的 cookie 清除 ( 清除 udemy 網站的就可以了 ),然後重新點選優惠連結並登入 Udemy 就可以了
- ❤️記得透過電腦瀏覽器登入 udemy ,使用這個✨優惠連結✨購買線上課程,本站可獲得 udemy 推薦獎金,歡迎透過我們的 A-Z 關鍵字索引 或 Udemy 策展找到您想要的課程
- ❤️訂閱開源報報 – 週一到週五每天使用中文報導三則開源專案
- ❤️LN+ for udemy/youtube/hahow/web 無縫整合 Notion 成為線上學習平台筆記工具
- ❤️更多付費服務(電子書/其他線上課程平台/軟體服務 )……
你必須登入才能發表留言。