自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

華為終端BG李小龍曝出業(yè)界翻車難題:手機拍攝的模糊文字,用AI增強很容易翻車 原創(chuàng)

發(fā)布于 2025-1-3 14:15
瀏覽
0收藏

編輯 | 言征

出品 | 51CTO技術(shù)棧(微信號:blog51cto)

近日,華為終端BG李小龍發(fā)博展示了Mate70 Pro+的AI照片增強的功能,并熱心詢問大家對于AI云增強效果是否滿意。

華為終端BG李小龍曝出業(yè)界翻車難題:手機拍攝的模糊文字,用AI增強很容易翻車-AI.x社區(qū)圖片

為了方便大家查看效果,大家可以點擊下面的大圖來查看AI增強效果。

華為終端BG李小龍曝出業(yè)界翻車難題:手機拍攝的模糊文字,用AI增強很容易翻車-AI.x社區(qū)左側(cè)是原圖,右側(cè)是AI增強圖

華為終端BG李小龍曝出業(yè)界翻車難題:手機拍攝的模糊文字,用AI增強很容易翻車-AI.x社區(qū)左側(cè)是原圖,右側(cè)是AI增強圖

不過一位好奇的網(wǎng)友在評論區(qū)問了一個讓李小龍非常關(guān)注的問題:小龍總,高倍率看不清楚的字能AI(增強)嗎,最好要自然點,不能弄成假的。

華為終端BG李小龍曝出業(yè)界翻車難題:手機拍攝的模糊文字,用AI增強很容易翻車-AI.x社區(qū)圖片

李小龍回復:文字用AI增強太容易翻車了,當前還屬于業(yè)界難題。

華為終端BG李小龍曝出業(yè)界翻車難題:手機拍攝的模糊文字,用AI增強很容易翻車-AI.x社區(qū)圖片


1.AI云增強是什么

先來回顧科普下這里的華為AI云增強是什么?

這就要首先提一下AI云相機功能,這項功能是華為在2023年10月推出的,

當時余承東給了一個形象的例子——

“以前大家在拍集體大合影的時候,會發(fā)現(xiàn)很難做到圖像放大后所有人的面貌細節(jié)都清晰可見。華為Mate60 Pro、 華為MateX5等手機在拍照上全新推出令人震撼的AI云增強功能,通過云端的億級參數(shù)大模型算法,捕捉并恢復隱藏在圖像中的微小細節(jié),帶來更清晰細膩的人像體驗。

無論是50人的大合影還是單人照,人像膚質(zhì)都更加透亮細膩,人人都是主角。即使把照片放大,二次裁剪構(gòu)圖,細節(jié)依然非常清晰。歡迎大家升級體驗!”

華為終端BG李小龍曝出業(yè)界翻車難題:手機拍攝的模糊文字,用AI增強很容易翻車-AI.x社區(qū)圖片

剛過去的2024年,11月底華為發(fā)布了Mate70系列,在影像技術(shù)繼續(xù)甩出了升級大招:Mate 70系列影像攝影在業(yè)界首次搭載了“紅楓原色攝像傳感器”,讓畫面呈現(xiàn)更加豐富的層次感和真實感,也帶來了AI云相機功能的史詩級增強——長焦云端大模型。

自然,史上最強Mate旗艦Mate70系列也在AI云增強功能上做了創(chuàng)新,針對長焦10x及以上的任意拍攝場景(不在僅限于人物合照),Al 云增強可以智能提升照片清晰度,立顯高清質(zhì)感。

華為官網(wǎng)如是介紹該功能,AI 云增強功能可智能分析用戶拍攝的照片,基于云端的億級參數(shù)大模型算法,捕捉并恢復隱藏在圖像中的微小細節(jié),提升照片清晰度。該功能支持:

  • 拍照模式和人像模式下拍攝的人像照片、花卉照片、寵物照片(支持 20X 以下)。
  • 微距模式下拍攝的照片:在相機拍照模式下,近距離拍攝物體自動進入微距,或在相機【更多】頁面中選擇超級微距模式,拍攝 20cm 以內(nèi)物體
  • 支持拍照模式下 10X 及以上任意場景的照片(月亮模式拍攝的照片除外)。

目前 AI 云增強功能支持的手機設(shè)備情況如下:

  • 人像照片:Mate70 系列、Mate X6、Mate XT、Pura 70 系列、 Mate 60 系列、Mate X5、Pocket 2 和 nova 12 Ultra
  • 花卉及微距照片:Mate XT、Pura 70 系列和 Mate 70 系列
  • 寵物照片、10X 及以上任意場景照片:Mate 70 系列

AI在照片上生成文字為什么這么難?

誠如李小龍所說,目前不要說高倍率模糊文字AI修復,即便讓AI在現(xiàn)成圖片上添加文字,都很難正確做到。

為什么呢?

首先,目前市面上用于圖片生成或照片修復的AI工具在訓練過程中,并未專門針對語言文字的復雜性和精確性進行深入學習。因此,當AI圖片工具面對生成文字的任務(wù)時,它自然不能很好完成任務(wù)。

其次,就是用于AI文字生成的訓練數(shù)據(jù)嚴重不足。在AI訓練過程中,并未接觸到足夠的文字樣本的“標簽”,由于它的基礎(chǔ)語料中沒有相應(yīng)文字的精確“標簽”,或者訓練者在訓練時有意避開了包含文字的圖像,以防止生成不恰當?shù)膬?nèi)容或侵犯版權(quán),這都會導致他的基礎(chǔ)數(shù)據(jù)不足。

另外,還有語義理解上的難題。文字的生成涉及到對自然語言的深入理解,這也是一個相對復雜的問題。

華為終端BG李小龍曝出業(yè)界翻車難題:手機拍攝的模糊文字,用AI增強很容易翻車-AI.x社區(qū)圖片

當然李老師所提的則是讓AI修復高倍率照片中模糊文字的問題,李老師回復:容易翻車,那就說明華為應(yīng)該已經(jīng)在研究這方面的內(nèi)容,期待華為的新成果!

參考鏈接:

??https://zhuanlan.zhihu.com/p/10160709558??

??https://www.zhihu.com/question/628375704/answer/3343109727??

本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:言征

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關(guān)推薦