目前分類:未分類文章 (23)

瀏覽方式: 標題列表 簡短摘要
 
 
作者 / 無念
編輯 / 1674
 
國慶檔高潮落幕,本周也算是國慶檔后主力新片登場的首周,多部影片上映,其中最受關注的無疑是《圖蘭朵魔咒緣起》。
 
 
 
以首映日情況來看,在同檔期新片中,《圖蘭朵:魔咒緣起》拿到超20%的排片,是所有新片中排片率最高的一部,僅次于國慶檔霸主《長津湖》。作為一部東方奇幻大片,《圖蘭朵:魔咒緣起》自立項以來就備受關注,一路而來期待聲與爭議聲并行,尤其圍繞影片“東方奇幻”類型、混搭演員陣容、如何將西方IP進行東方化演繹等,這既是影片的重點所在,也是不少人觀望的重點。
 
前陣子影片也舉辦了業內看片會,大家的反饋表現不錯,如“很久沒看過這樣的國產奇幻大片”“電影版進行了大刀闊斧的改編,超出了我原本的預期”“是一次很大膽的嘗試”等,那么,《圖蘭朵:魔咒緣起》究竟是一部什么樣的影片呢?
 
注:下文簡稱《圖蘭朵:魔咒緣起》為《圖蘭朵》
 
 
 
瑕不掩瑜,中西結合的「新東方奇幻大片」
 
結合過往歷史來看,東方奇幻向來是個創作難題,尤其在內容全球化競爭的背景下,如何保持東方奇幻的獨特性與本土性,也是許多影片及其背后創作者始終在嘗試和突破之處,而《圖蘭朵:魔咒緣起》無疑是這一命題下的又一次創作挑戰。
 
作為一部東方視角下的奇幻愛情電影,影片還是以普世情感為主線,同時融合大量豐富內容元素如權謀、復仇、欲望、戰爭、魔咒等,構架出一個更為多元融合的世界觀。
 
相比以往的東方奇幻作品,《圖蘭朵》故事的根源并不在中國,而是改編自意大利歌劇作曲家普契尼創作的歌劇,原作講述的是一個西方人想象中的中國傳奇故事,此次電影改編最大的突破就是將故事視角、世界觀架構以及主角形象塑造、情感表達方式等都做了改編,將其變成一個東方人講述的東方故事。
 
 
 
例如故事打造了一個萬民來朝的強國大汗國,如氣勢恢宏的山川、典雅大氣的宮殿、琳瑯滿目的珍寶,以及站在地圖上代表各地域各民族的使者,無一不象征著大汗國的富饒與強盛。
 
又如故事主角是一個剛柔并濟的東方女子,看似冷若冰霜實則渴求真摯的情感,為了心愛的人也甘愿作出犧牲,這樣的一位東方公主形象實際與原作當中殘酷無情的公主有著很大的區別。同時影片中的圖蘭朵公主既是紡織高手、身手也頗為矯健,亦有巾幗英雄的影子。
 
 
 
既然是東方奇幻故事,那么視效維度也需得有相匹配的水準,從《圖蘭朵》中也可以看到大汗國的廣袤風光、驚險刺激的戰爭場面、以及絢爛奪目的煙花綻放,在觀影口碑中對于影片的視效制作也評價不錯,有人說“影片的畫面無疑是非常值得關注的重點,電影對于色彩的呈現和運用帶來了一種絢爛的美感”,也有人說“視覺特效很棒且奇幻色彩濃郁”。
 
 
 
當然,《圖蘭朵》也存在一定的問題,如人物形象的塑造、情感深度的挖掘、劇情細節的邏輯性等都有提升空間,但依然可以確定的是《圖蘭朵》完成了一次對于東方奇幻的創作突破,其將自身的內容維度進行了拓展,融合更豐富的元素與多元風格,將“圖蘭朵”IP進行了中西結合的升級,形成了這樣一部新鮮有趣的作品。
 
 
意想不到的組合帶來意想不到的奇妙
 
在類型獨特的同時,《圖蘭朵》的陣容無疑是其受到關注和熱議的另一大亮點,如導演鄭曉龍、編劇王小平,以及領銜主演關曉彤、胡軍,友情出演姜文,特別出演蘇菲·瑪索等,這樣的混搭組合陣容一官宣就引發了大家的好奇。
 
其中,姜文飾演的大汗率先以“雙馬尾”造型出圈,作為華語影壇的大佬級人物,此次加盟《圖蘭朵》并飾演一位“寵女狂魔”,在片中既有身為一國之主威嚴的一面,也有在愛女面前父愛萌動的可愛一面,反差萌之下讓這個角色頗為有趣。片中另一位重要男性角色即胡軍飾演的泊炎將軍,其不僅是影片中的武力值擔當,同時也將反派角色的狂妄形態進行了豐富有趣的展現。
 
 
 
值得一提的是影片中東方公主圖蘭朵的飾演者關曉彤,故事中的圖蘭朵是一位美貌且內心情感復雜的女性人物,關曉彤此次將這位新語境下的東方公主塑造得不錯,尤其在武打戲份方面,向來恐高的關曉彤親自上陣吊威亞,做出了突破。
 
此外,片中的另一大亮點女性角色則是來自蘇菲·瑪索飾演的王后,法蘭西女神風韻依舊,每每出場都令人驚艷,而且此次參演《圖蘭朵》也是蘇菲·瑪索的首次觸電華語片。
 
 
 
影片幕后班底則是業內口碑組合——導演鄭曉龍與編劇王小平,兩人合作過《刮痧》等經典作品,此次夫妻二人再度聯手打造電影《圖蘭朵》,更令人期待。
 
 
 
高關注度的混搭陣容外,劇組在制片上也下了不少功夫。如在大汗國大殿的設計上摒棄了以往金碧輝煌的殿堂形象,而是選擇了更古樸的木質風格;又如為了呈現影片大氣磅礴的其實,影片進行了大量的實景、長鏡頭拍攝,還有影片中涉及到20多個國家的人物形象展現,劇組前期參考了大量資料,對于衣著服飾的色彩、材料等進行解構和重新設計,以融入《圖蘭朵》的世界。
 
 
東方奇幻大片發展的再探索
 
影片正式上映,關于影片的爭議與質疑也都會在內容中得到回答,而回看《圖蘭朵》這部影片在創作方向上的探索以及文化傳輸上的表達,其實是頗有意義的。
 
從意大利歌劇到中國奇幻大片,《圖蘭朵》不僅突破了由歌劇向電影改編的創作,同時融入了典型且豐富的中國文化元素,將這個世界經典歌劇故事重新演繹了出來,并展現出東方奇幻電影的獨特風貌。這既是對外來文化的吸收,同時也是本土文化的一次革新和傳播。
 
比如電影中出現了各式煙花、絲綢等多個中國文化符號。煙花代表了美好,也寄托著人們的心愿,通過煙花的燃燒,影片將這種美傳遞給全世界,也把和平的種子灑遍全世界。另外,片中也有一些中國文化和中國哲學的體現,比如將紡織用作武器,以柔化剛,以弱克強,這其中也蘊含著舉重若輕的東方式哲思。
 
用中國式內核來講述西方的故事,詮釋解構世界經典,一起講述中國故事。在這樣的基礎上,《圖蘭朵》不再是一個西方人眼中臆想的東方故事,而真真切切地具備了獨屬于東方文化的本土思考,呈現出一段東方奇幻的傳奇形態。
 
同時從影片維度來看,《圖蘭朵》也是一部典型的東方童話,站在成年人的角度講述了一段頗有童話質感的傳奇,故事以愛為主題,展現了人性的多面、戰爭的罪與罰以及人類情感的美好。
 
 
 
 
對于“圖蘭朵”IP的解構是影片創作此次的最大突破,而立足于本土視角、呈現東方奇幻傳奇、傳達東方傳統文化,則是《圖蘭朵》創作的最大意義。
 
至少可以說,在東方奇幻大片的發展道路上,《圖蘭朵》做出了一定的貢獻。
 
 
 
近期熱文
 
國慶檔重新雄起,但隱憂更多
未來大檔期頭部影片數量會減少嗎?
大檔期延后消費熱,「國慶檔后半場」才開幕

 

 

 

文章標籤

s7g22qtt 發表在 痞客邦 留言(0) 人氣()

 

茫茫人海中,為防大家走失,請大家

點擊上方 “”點擊右上角“...”點選“設為星標 ★ ”
加上星標,就再也不會迷路啦

 

文章標籤

s7g22qtt 發表在 痞客邦 留言(0) 人氣()

報道

編輯部
來自微軟的研究者另辟蹊徑,提出了一種新的計算機視覺基礎模型 Florence。在廣泛的視覺和視覺 - 語言基準測試中,Florence 顯著優于之前的大規模預訓練方法,實現了新的 SOTA 結果。
 
面對多樣化和開放的現實世界,要實現 AI 的自動視覺理解,就要求計算機視覺模型能夠很好地泛化,最小化對特定任務所需的定制,最終實現類似于人類視覺的人工智能。計算機視覺基礎模型在多樣化的大規模數據集上進行訓練,可以適應各種下游任務,對于現實世界的計算機視覺應用至關重要。
 
現有的視覺基礎模型,如 CLIP (Radford et al., 2021)、ALIGN (Jia et al., 2021) 和悟道 2.0 等 ,主要側重于將圖像和文本表征映射為跨模態共享表征。近日來自微軟的研究另辟蹊徑提出了一種新的計算機視覺基礎模型 Florence,將表征從粗粒度(場景)擴展到細粒度(對象),從靜態(圖像)擴展到動態(視頻),從 RGB 擴展到多模態。
 
通過結合來自 Web 規模圖像 - 文本數據的通用視覺語言表征, Florence 模型可以輕松地適應各種計算機視覺任務,包括分類、檢索、目標檢測、視覺問答(VQA)、圖像描述、視頻檢索和動作識別。此外,Florence 在許多遷移學習中也表現出卓越的性能,例如全采樣(fully sampled)微調、線性探測(linear probing)、小樣本遷移和零樣本遷移,這些對于視覺基礎模型用于通用視覺任務至關重要。Florence 在 44 個表征基準測試中多數都取得了新的 SOTA 結果,例如 ImageNet-1K 零樣本分類任務,top-1 準確率為 83.74,top-5 準確率為 97.18;COCO 微調任務獲得  62.4 mAP,VQA 任務獲得 80.36 mAP。
 
 
 
論文地址:https://arxiv.org/pdf/2111.11432v1.pdf
 
 
Florence 模型在有噪聲的 Web 規模數據上以同一個目標進行端到端訓練,使模型能夠在廣泛的基準測試中實現同類最佳性能。在廣泛的視覺和視覺 - 語言基準測試中,Florence 顯著優于之前的大規模預訓練方法,實現了新的 SOTA 結果。
 
方法
 
構建 Florence 生態系統包括數據管護、模型預訓練、任務適配和訓練基礎設施,如圖 2 所示。
 
 
 
數據管護
 
由于大規模數據多樣化對基礎模型非常重要,因此該研究提出了一個包含 9 億個圖像 - 文本對的新數據集用于訓練。由于網絡爬取數據通常是具有噪音的自由格式文本(例如,單詞、短語或句子),為了獲得更有效的學習,該研究使用了 UniCL,這是 Yang 等人最近提出的「統一圖像文本對比學習對象」,這種方法已經被證明其比對比和監督學習方法更優越。
 
模型預訓練
 
為了從圖像 - 文本對中學習良好的表示,該研究使用了包括圖像編碼器和語言編碼器的兩塔式(two-tower)架構。對于圖像編碼器,該研究選擇了分層 Vision Transformer 。該研究所提架構在繼承了 Transformer self-attention 操作性能優勢的同時,這些分層架構對圖像的尺度不變性進行了建模,并且具有相對于圖像大小的線性計算復雜度,這是進行密集預測任務必不可少的屬性。
 
任務適配
 
該研究使用 dynamic head adapter(Dai et al., 2021a)、提出的 video CoSwin adapter 從靜態圖到視頻的時間、METER adapter 從圖像到語言的模態變化,通過以上該研究將學習到的特征表示沿空間(從場景到對象)進行擴展。Florence 旨在通過小樣本和零樣本遷移學習來有效適配開放世界,并通過很少的 epoch 訓練(例如在檢索中)進行有效部署。用戶可以根據自己的需求進行定制。
 
Dynamic Head (Dai et al., 2021a) adapter 用于對象級視覺表示學習。
 
圖 4. METER (Dou et al., 2021) 用作 Florence V+L 適配模型,使用圖像文本匹配 (ITM) 損失和掩碼語言建模 (MLM) 損失進行訓練。
 
訓練基礎設施
 
從能源和成本方面考慮,以盡可能低的成本構建基礎模型是至關重要的。該研究開發了可擴展的訓練基礎設施,以提高訓練效率。Florence 訓練基礎設施由 ZeRO 、激活檢查點、混合精度訓練、梯度緩存等多項關鍵技術組成,從而大大減少了內存消耗,提高了訓練吞吐量。
 
實驗結果
 
該研究進行了多項實驗,表明了 Florence 顯著優于之前的大規模預訓練方法。
 
分類中的零樣本遷移
 
 
該研究在 ImageNet-1K 數據集和 11 個下游數據集上評估了 Florence 模型。表 1 顯示了這 12 個數據集的結果,比較的模型包括 CLIP ResNet 、CLIP Vision Transformer 模型以及 FILIP-ViT,結果顯示 Florence 在其中 9 個數據集上表現出色。該研究在 ImageNet-1K 上的零樣本遷移方面取得了顯著的提高,即 top-1 準確率為 83.74%(比 SOTA 結果高 5.6%),top-5 準確率為 97.18%。
 
 
線性評估
 
 
線性評估考慮了 11 個分類基準,這些基準同樣也適用于零樣本分類遷移。該研究將 Florence 與具有 SOTA 性能的模型進行了比較,包括 SimCLRv2、ViT、Noisy Student 和 CLIP 。
 
結果表明,Florence 優于現有的 SOTA 結果,不過在 CIFAR10、CIFAR100 這兩個數據集上性能不如 EfficientNet-L2 。
 
 
 
ImageNet-1K 微調評估
 
該研究在 ImageNet ILSVRC-2012 基準(Deng et al., 2009)上評估了持續微調的性能,Florence 與幾種模型的比較結果如下表 3 所示。Florence 模型的 Top-1 和 Top-5 準確率均優于 BiT(Kolesnikov et al., 2020)和 ALIGN(Jia 等人,2021 年)。Florence 的結果比 SOTA 模型(Dai et al., 2021c)稍差,但其模型和數據規模都比 Florence 大了 3 倍。
 
 
 
小樣本跨域分類
 
下表 4 顯示了 Florence 模型適應 CDFSL 基準的結果。與采用集成學習(ensembes learning)和直推學習(transductive learning)的挑戰基準獲勝者(Liu et al., 2020,下表中用 CW 指代)相比,Florence 采用單一模型,沒有對測試數據進行轉換,但獲得了更優的結果。
 
 
圖像 - 文本檢索
 
表 5 展示了 Florence 在 Flickr30k 和 MSCOCO 數據集上在文本和圖像檢索任務上的零樣本遷移和微調性能。結果表明,在這兩個數據集上,Florence 優于之前所有的微調結果。此外,該方法對檢索微調更有效。
 
 
目標檢測和零樣本遷移
 
目標檢測是計算機視覺中最突出的應用之一。與現有的大規模預訓練模型(如 CLIP、ALIGN 和 Wu Dao 2.0)相比,Florence 更適用于目標檢測任務,因為它的適應性有助于學習對象級視覺表征。研究者通過微調目標檢測和零樣本遷移任務對來 Florence 的對象級視覺表征性能進行評估。
 
具體地,研究者在 3 個流行的目標檢測數據集上評估了微調性能,它們分別是 COCO(Lin et al., 2015)、Object365(Shao et al., 2019)和 Visual Genome(Krishna et al., 2016)。下表 6 展示了與 SOTA 結果的比較,可以看到,Florence 在這些目標檢測基準上取得了新的 SOTA 結果。
 
 
為了評估 Florence 對新的、多樣性和面向應用的任務的遷移性,研究者遵循 (Li et al., 2021b) 設計了一個「開放式目標檢測基準」,該基準聚合了來自 Roboflow2 的 11 個公共數據集,涵蓋了細粒度魚類 / 象棋檢測、無人機視野檢測和 thermal 目標檢測等多樣性場景。下表 7 表明,Florence 模型能夠有效地實現到這些任務的零樣本遷移。
 
 
視覺語言(V+L)表示學習
 
研究者在具有挑戰性的 VQA (Goyal et al., 2017) 任務上對預訓練模型進行了微調,該任務是根據圖像上下文來回答問題。下表 8 展示了與當前方法的比較,結果表明 Florence 實現的了新的 SOTA 性能。與使用了 1.8B 圖像到文本對的 SimVLM 模型(Wang et al., 2021)相比,Florence 僅使用 900M 數據即可以預訓練圖像編碼器,20M 數據即可以預訓練視覺語言預訓練(VLP),但取得的結果更好。這也證明了 Florence 的數據效率。
 
 
零樣本文本到視頻檢索
 
 
研究者在 MSR-VTT (Xu et al., 2016) 數據集上執行了零樣本文本到視頻評估,他們報告了在 1K-A test(Yu et al., 2018,包含 1k 個視頻和字幕對)上的結果, 并在下表 9 中與當前 SOTA 方法進行了比較。結果表明,CLIP6(Radford et al., 2021)和 Florence 這兩個圖像到文本預訓練模型在 R@1 指標上遠遠優于其他所有 SOTA 方法。
 
 
視頻動作識別
 
研究者在微調視頻動作識別任務上對 Florence 進行評估。下表 10 展示了 Florence 與當前 SOTA 方法的比較,結果表明在 Kinectics-400 和 Kinectics-600 兩個數據集上,分別比 SOTA 方法提升 1.1% 和 1.5%。
 
 
 

詳解NVIDIA TAO系列分享第2期:

文章標籤

s7g22qtt 發表在 痞客邦 留言(0) 人氣()

«12