【導(dǎo)讀】設(shè)Doc1,Doc2,Doc3是三個文件.一些術(shù)語在這三個文件中的出現(xiàn)情況如下表:. 想要的查不出來.行d列,矩陣名為X.矩陣的元素為術(shù)語在文件中的出現(xiàn)頻度.數(shù)學(xué)上可以證明:X可以分解為三個矩陣T0,S0,D0'的積.其中T0和D0. 一般要求T0,S0,D0都是滿秩的.不難做到把S0的元素沿對角線從大到小排列.Xhat在最小二乘意義(?)下是X的最佳近似!這樣,我們實際上有了一個"降維"的途。恰巧就是Xhat本身.它的第i行第j列表明了術(shù)語i和文件j的相關(guān)聯(lián)程度.是不是存在某種分解是基于另一種分解的?比如先拆成兩個矩陣,再把其中某個再拆解。海洋和遠(yuǎn)帥希望能做補充。比如對稀疏和密集矩陣不同的算法。常用的線性代數(shù)數(shù)學(xué)庫?;诙嗪硕嗵幚砥饕约皺C群的數(shù)學(xué)庫?;贕PU并行加速的解決方案。ISVD-CUDA——沒有源代碼