正文內容

雙三次插值及優(yōu)化-全文預覽

2025-08-26 04:18 上一頁面

下一頁面

　　

【正文】 d2按位與ANDPS xmm0,xmm1/m128ORPDBitwise Logical OR of DoublePrecision FloatingPoint ValuesOpcodeInstructionDescription66 0F 56 /rORPD xmm1, xmm2/m128Bitwise OR of xmm2/m128 and xmm1.DEST[1270] DEST[1270] BitwiseOR SRC[1270]。r32[1] SRC[15]。* repeat operation for bytes 2 through 6。 DEST[1] SRC[127]。 DEST[314] 0000000H。MOVHPD instruction for XMM to memory move:DEST SRC[12764] 。MOVDQA Move Aligned Double QuadwordInstructionDescriptionMOVDQA xmm1, xmm2/m128Move aligned double quadword from xmm2/m128 to xmm1.MOVDQA xmm2/m128, xmm1Move aligned double quadword from xmm1 to xmm2/m128.MOVDQU Move Unaligned Double QuadwordInstructionDescriptionMOVDQU xmm1, xmm2/m128Move unaligned double quadword from xmm2/m128 to xmm1.MOVDQU xmm2/m128, xmm1Move unaligned double quadword from xmm1 to xmm2/m128.MOVHLPS Move Packed SinglePrecision FloatingPoint Values High to LowInstructionDescriptionMOVHLPS xmm1, xmm2Move two packed singleprecision floatingpoint values from high quadword of xmm2 to low quadword of xmm1.DEST[630] SRC[12764]。RSQRTSSScalar SinglePrecision FloatingPoint Square Root ReciprocalOpcodeInstructionDescriptionF3 0F 52 /rRSQRTSS xmm1, xmm2/m32Returns to xmm1 an approximation of the reciprocal of the square root of the low singleprecision floatingpoint value in xmm2/m32.DEST[310] APPROXIMATE((SRC[310]))。RSQRTPSPacked SinglePrecision FloatingPoint Square Root ReciprocalOpcodeInstructionDescription0F 52 /rRSQRTPS xmm1, xmm2/m128Returns to xmm1 the packed approximations of the reciprocals of the square roots of the packed singleprecision floatingpoint values in xmm2/m128.DEST[310] APPROXIMATE((SRC[310]))。DEST[9564] APPROXIMATE((SRC[9564]))。DIVSSScalar SinglePrecision FloatingPoint Divide DIVSS xmm0, xmm1/m32DEST[310] DEST[310] / SRC[310]。DEST[9564] DEST[9564] / (SRC[9564])。DIVPDPacked DoublePrecision FloatingPoint Divide DIVPD xmm0, xmm1/m128DEST[630] DEST[630] / (SRC[630])。MULSDScalar DoublePrecision FloatingPoint MultiplyOpcodeInstructionDescriptionF2 0F 59 /rMULSD xmm1, xmm2/m64Multiply the low doubleprecision floatingpoint value in xmm2/mem64 by low doubleprecision floatingpoint value in xmm1.DEST[630] DEST[630] * xmm2/m64[630]。MULPSPacked SinglePrecision FloatingPoint MultiplyOpcodeInstructionDescription0F 59 /rMULPS xmm1, xmm2/m128Multiply packed singleprecision floatingpoint values in xmm2/mem by xmm1.DEST[310] DEST[310] * SRC[310]。PMULUDQ instruction with 128Bit operands:DEST[630] DEST[310] * SRC[310]。附：SSE2指令整理算術(Arithmetic)指令：ADDPDPacked DoublePrecision FloatingPoint Add SSE2 2個double對應相加ADDPD xmm0, xmm1/m128ADDPSPacked SinglePrecision FloatingPoint Add SSE 4個float對應相加ADDPS xmm0, xmm1/m128ADDSDScalar DoublePrecision FloatingPoint Add 1個double(低端)對應相加 SSE2ADDSD xmm0, xmm1/m64ADDSSScalar SinglePrecision FloatingPoint Add SSE 1個float(低端)對應相加ADDSS xmm0, xmm1/m32PADDB/PADDW/PADDDPacked AddOpcodeInstructionDescription0F FC /rPADDB mm, mm/m64Add packed byte integers from mm/m64 and mm.66 0F FC /rPADDB xmm1,xmm2/m128Add packed byte integers from xmm2/m128 and xmm1.0F FD /rPADDW mm, mm/m64Add packed word integers from mm/m64 and mm.66 0F FD /rPADDW xmm1, xmm2/m128Add packed word integers from xmm2/m128 and xmm1.0F FE /rPADDD mm, mm/m64Add packed doubleword integers from mm/m64 and mm.66 0F FE /rPADDD xmm1, xmm2/m128Add packed doubleword integers from xmm2/m128 and xmm1.PADDQPacked Quadword AddOpcodeInstructionDescription0F D4 /rPADDQ mm1,mm2/m64Add quadword integer mm2/m64 to mm166 0F D4 /rPADDQ xmm1,xmm2/m128Add packed quadword integers xmm2/m128 to xmm1PADDSB/PADDSWPacked Add with SaturationOpcodeInstructionDescription0F EC /rPADDSB mm, mm/m64Add packed signed byte integers from mm/m64 and mm and saturate the results.66 0F EC /rPADDSB xmm1, 。 cpuid。 3. 算法優(yōu)化由于雙三次插值計算一個點的坐標需要其周圍16個點，更有多達20次的乘法及15次的加法，計算量可以說是非常大，勢必要進行優(yōu)化。 1. 獲取16個點的坐標PP2……P16 2. 由插值核計算公式S(x) 分別計算出x、y方向的插值核向量Su、Sv 3. 進行矩陣運算，得到插值結果 iTemp1 = Su0 * P1 + Su1 * P5 + Su2 * P9 + Su3 * P13 iTemp2 = Su0 * P2 + Su1 * P6 + Su2 * P10 + Su3 * P14 iTemp3 = Su0 * P3 + Su1 * P7 + Su2 * P11 + Su3 * P15 iTemp4 = Su0 * P4 + Su1 * P8 + Su2 * P12 + Su3 * P16 iResult = Sv1 * iTemp1 + Sv2 * iTemp2 + Sv3 * iTemp3 + Sv4 * iTemp4 4. 在得到插值結果圖后，我們發(fā)現圖像中有“毛刺”，因此對插值結果做了個后處理，即：設該點在原圖中的像素值為pSrc，若abs(iResult pSrc) 大于某閾值，我們認為插值后的點可能污染原圖，因此用原像素值pSrc代替。 __asm { mov eax, 1。 mov g_bSSE2, 1 NotSupport: } 支持SSE2的CPU引入了8個128位的寄存器，這樣一個寄存器中就可以存放4個點(RGB)，有利于并行計算。3. 為了消除除法及浮點運算，對權值放大256倍，這樣在計算插值核時，必須用2Bytes來表示1個系數，而圖像數據都是1Byte，這樣在對齊做乘法時，要浪費一半的SSE2寄存器的空間，導致運算時間變長；而若降低插值核的精度，使其在1Byte表示范圍內時，運算的精度又大為下降；4. 對各指令的周期以及若干行指令是否能夠并行流水缺乏經驗和認識。 the 8 low differences and 8 high differences are then summed separately to produce two word integer results.PSUBB/PSUBW/PSUBDPacked SubtractOpcodeInstructionDescription0F F8 /rPSUBB mm, mm/m64Subtract packed byte integers in mm/m64 from packed byte integers in mm.66 0F F8 /rPSUBB xmm1, xmm2/m128Subtract packed byte integers in xmm2/m128 from packed byte integers in xmm1.0F F9 /rPSUBW mm, mm/m64Subtract packed word integers in mm/m64 from packed word integers in mm.66 0F F9 /rPSUBW xmm1, xmm2/m128Subtract packed word integers in xmm2/m128 from packed word integers in xmm1.0F FA /rPSUBD mm, mm/m64Subtract packed doubleword integers in mm/m64 from packed doubleword integers in mm.66 0F FA /rPSUBD xmm1, xmm

點擊復制文檔內容

黨政相關相關推薦

學習十三次黨代會三次會議情況-資料下載頁

【摘要】第一篇：學習十三次黨代會三次會議情況財政局深入學習貫徹中國共產黨延吉市第十三次代表大會第三次會議精神匯報為全面貫徹落實延吉市第十三次黨代會第三次會議精神，把學習貫徹活動引向深入，按照黨工委...

2024-10-24 23:25

課程設計---hermite插值法的程序設計及應用-資料下載頁

【摘要】課程設計說明書題目：Hermite插值法的程序設計及應用學生姓名：畢美喬學院：理學院班級：信計09-2指導教師：李曉瑜任文秀2020年1月5日學校代碼：

2025-05-20 15:15

牛頓插值法ppt課件(2)-資料下載頁

【摘要】iiijjijiilxlbx?????11?????????????nnnnnnaaaaaaaaaA???????212222111211bAx?ni,,3,2??Newton插值法§

2025-05-01 12:05

插值法及其matlab實現(1)-資料下載頁

【摘要】數值分析NumericalAnalysis主講教師：牛曉穎河北大學質監(jiān)學院描述事物之間的數量關系：函數。有兩種情況：一是表格形式——一組離散的數據來表示函數關系；另一種是函數雖然有明顯的表達式，但很復雜，不便于研究和使用。從實際需要出發(fā)：對于計算結果允許有一定的誤差，

2025-05-15 05:55

三次產業(yè)劃分規(guī)定-資料下載頁

【摘要】三次產業(yè)劃分規(guī)定一、根據《國民經濟行業(yè)分類》(GB/T4754—2002)，制定本規(guī)定。二、三次產業(yè)劃分范圍如下：第一產業(yè)是指農、林、牧、漁業(yè)。第二產業(yè)是指采礦業(yè)，制造業(yè)，電力、燃氣及水的生產和供應業(yè)，建筑業(yè)。第三產業(yè)是指除第一、二產業(yè)以外的其他行業(yè)。第三產業(yè)包括：交通運輸、倉儲和郵政業(yè)，信息傳輸、計算機服務和軟件業(yè)，批發(fā)和零售業(yè)，住宿和餐飲業(yè)，金融業(yè)，

2025-04-07 22:38

[法學]第2章插值法-資料下載頁

【摘要】1計算方法電子教案中南大學數學科學學院應用數學與應用軟件系2第二章插值法§1引言§2拉格朗日插值多項式§3牛頓插值多項式§4分段低次插值§5三次樣條插值§6數值微分3§1

2025-01-19 13:58

空間插值方法簡介ppt課件-資料下載頁

【摘要】空間插值方法基于ArcMap主要內容?概念及分類?主要步驟概念及分類?概念?重要性?分類概念重要性重要性?從采樣點位數據，到整個區(qū)域的應用。?用已知樣點預測未知樣點（不僅僅是自身）基本

2025-05-04 07:26

[法學]第4章插值法-資料下載頁

【摘要】科學和工程計算第4章插值法插值法?插值法是一種古老的數學方法，早在一千多年前的隋唐時期定制歷法時就廣泛應用了二次插值。劉焯將等距節(jié)點的二次插值應用于天文計算。?插值理論卻是在17世紀微積分產生后才逐步發(fā)展起來的，Newton插值公式理論是當時的重要成果。?由于計算機的使用以及航空、造船、精密儀器的加工，插值法在理論和

2025-03-22 02:20

三次調研計劃word版-資料下載頁

【摘要】第三次調研一、調研目的1、全廠進廠物資、出廠物資及中間環(huán)節(jié)的所有物資流轉過程中的品質檢驗流程。2、全廠進廠物資、出廠物資及中間環(huán)節(jié)的所有物資流轉過程中的數量檢驗（包括生產運行中能源的統(tǒng)計）。3、技術中心能耗的平衡、制定、計劃、工藝指標的制定流程。4、技術質量部的質量異議處理。（包括質量及數量）二、涉及部門品質部、計控部、技術中心、技術質量部、能源中心煉鐵、燒結

2025-01-19 04:05

線性插值法計算公式解析-資料下載頁

【摘要】線性插值法計算公式解析2011年招標師考試實務真題第16題：某機電產品國際招標項目采用綜合評價法評標。評標辦法規(guī)定，產能指標評標總分值為10分，產能在100噸/日以上的為10分，80噸/日的為5分，60噸/日以下的為0分，中間產能按插值法計算分值。某投標人產能為95噸/日，應得（）分。A．B．C．D．分析：該題的考點屬線性插值法又稱為直線內插法，是評標

2025-06-24 06:59

醫(yī)德醫(yī)風第三次試題及答案-資料下載頁

【摘要】第一篇：醫(yī)德醫(yī)風第三次試題及答案總務科醫(yī)德醫(yī)風培訓試題名字：分數：一、選擇題（每題4分，共40分） 1、醫(yī)院人員利用工作之便向病人或其家屬暗示、索要“紅包”、“錢財”的，除如數追繳外，除...

2025-10-04 12:16

高三數學三次函數-資料下載頁

【摘要】三次函數---導數應用中一顆璀璨的明珠復習回顧例題精講課堂小結課后思考三次函數f(x)=ax3+bx2+cx+d(a≠0)?其導數為f′(x)=3ax2+2bx+c(a≠0)?導函數的判別式為△=4b2-12acx1x1x2三次函數---導數應用中一顆璀璨的明珠x2△≤0

2024-11-11 02:58

c語言插值算法ppt課件-資料下載頁

【摘要】插值算法講座人：鄧書莉時間：2022年12月9日編寫排版：鄧書莉插值算法?插值的定義?一維插值算法?最鄰近插值?線性插值?拉格朗日插值?牛頓插值?埃爾米特插值?三次樣條插值

2025-05-05 12:08

數值分析論文--代數插值法的論述-資料下載頁

【摘要】數值分析代數插值法的論述姓名：藺孝寶學號：12023316班級：1203學院：商洛學院數計學院數學與計算科學系日期商洛學院-1-代數插值法1.摘要插值法是函數逼近的重要方法之一，有著廣泛的應用。在生產和實驗中，函數f(x

2025-06-06 00:46

拉格朗日插值實驗報告-資料下載頁

【摘要】實驗名稱：實驗一拉格朗日插值1引言我們在生產生活中常常會遇到這樣的問題：某個實際問題中，函數f(x)在區(qū)間[a,b]上存在且連續(xù)，但卻很難找到其表達式，只能通過實驗和觀測得到有限點上的函數表。顯然，根據這些點的函數值來求其它點的函數值是非常困難的。有些情況雖然可以寫出表達式，但結構復雜，使用不方便。所以我們總是希望根據已有的數據點（或函數表）來構造某個簡單函數P(x)作為f(

2025-07-20 19:03