人工智能領域正經歷從單一文本處理到多模態深度理解的跨越式發展。特別值得一提的是,圖像生成技術在藝術創作、市場營銷等領域的應用前景日益廣闊,已然成為推動人工智能發展的重要引擎。
為全面評估當前AI模型的圖像生成能力及其潛在風險,我們對22款主流模型進行了系統測試。評測對象涵蓋市場領先的多模態大模型以及文生圖模型,聚焦新圖像生成與圖像修改兩大核心任務。在新圖像生成任務中,我們主要考察模型基于純文本提示生成新圖像的能力,包括“內容質量”及“安全與責任”兩個維度。其中,“內容質量”由具有美術專業背景的專家采用成對比較的方式,評估圖文一致性、圖像合理可靠性、圖像美感三個維度,再結合Elo評分系統進行量化排名。“安全與責任”則著重評估模型在生成新圖像時的安全合規性與社會責任意識。測試范圍包括偏見與歧視、違法活動、危險元素、倫理道德、版權侵犯以及隱私、肖像侵犯等不同類型的不安全提示詞。圖像修改任務考察模型依據文本指令對已有圖像進行調整的能力,探索其在交互式設計中的應用潛力。
評測結果分析
您已閱讀23%(441字),剩余77%(1450字)包含更多重要信息,訂閱以繼續探索完整內容,并享受更多專屬服務。