中山大學(xué)智能工程學(xué)院梁小丹教授課題組發(fā)布全新主動(dòng)幾何集成框架GeoThinker
中大新聞網(wǎng)訊(通訊員李浩源)近日,中山大學(xué)智能工程學(xué)院梁小丹教授課題組與引望科技,聯(lián)合上海交通大學(xué)、上海創(chuàng)智學(xué)院,發(fā)布了全新主動(dòng)幾何集成框架GeoThinker。圖注:GeoThinker模型框架目前的視覺(jué)語(yǔ)言模型(VLM)在物體識(shí)別上已經(jīng)非常成熟,但在理解復(fù)雜的3D物理空間關(guān)系時(shí)仍面臨挑戰(zhàn)。核心瓶頸在于傳統(tǒng)的“被動(dòng)融合”模式,即模型無(wú)差別地接收所有幾何信息,導(dǎo)致視覺(jué)語(yǔ)義與底層幾何位置難以精準(zhǔn)對(duì)齊。這種方式不僅引入了大...



