|
|
|
@ -390,10 +390,10 @@ cglobal mix_%1_to_%2_%3_flt, 3,in_channels+2,needed_mmregs+matrix_elements_mm, n |
|
|
|
|
S16_TO_S32_SX 4, 5 |
|
|
|
|
cvtdq2ps m4, m4 |
|
|
|
|
cvtdq2ps m5, m5 |
|
|
|
|
fmaddps m2, m4, mx_1_ %+ %%i, m2, m6 |
|
|
|
|
fmaddps m3, m5, mx_1_ %+ %%i, m3, m6 |
|
|
|
|
fmaddps m0, m4, mx_0_ %+ %%i, m0, m4 |
|
|
|
|
fmaddps m1, m5, mx_0_ %+ %%i, m1, m5 |
|
|
|
|
FMULADD_PS m2, m4, mx_1_ %+ %%i, m2, m6 |
|
|
|
|
FMULADD_PS m3, m5, mx_1_ %+ %%i, m3, m6 |
|
|
|
|
FMULADD_PS m0, m4, mx_0_ %+ %%i, m0, m4 |
|
|
|
|
FMULADD_PS m1, m5, mx_0_ %+ %%i, m1, m5 |
|
|
|
|
%else |
|
|
|
|
%if copy_src_from_stack |
|
|
|
|
mov src_ptr, src %+ %%i %+ m |
|
|
|
@ -402,8 +402,8 @@ cglobal mix_%1_to_%2_%3_flt, 3,in_channels+2,needed_mmregs+matrix_elements_mm, n |
|
|
|
|
S16_TO_S32_SX 2, 3 |
|
|
|
|
cvtdq2ps m2, m2 |
|
|
|
|
cvtdq2ps m3, m3 |
|
|
|
|
fmaddps m0, m2, mx_0_ %+ %%i, m0, m4 |
|
|
|
|
fmaddps m1, m3, mx_0_ %+ %%i, m1, m4 |
|
|
|
|
FMULADD_PS m0, m2, mx_0_ %+ %%i, m0, m4 |
|
|
|
|
FMULADD_PS m1, m3, mx_0_ %+ %%i, m1, m4 |
|
|
|
|
%endif |
|
|
|
|
%assign %%i %%i+1 |
|
|
|
|
%endrep |
|
|
|
@ -443,12 +443,12 @@ cglobal mix_%1_to_%2_%3_flt, 3,in_channels+2,needed_mmregs+matrix_elements_mm, n |
|
|
|
|
mova m2, [src_ptr+lenq] |
|
|
|
|
%endif |
|
|
|
|
%if stereo |
|
|
|
|
fmaddps m1, m2, mx_1_ %+ %%i, m1, m3 |
|
|
|
|
FMULADD_PS m1, m2, mx_1_ %+ %%i, m1, m3 |
|
|
|
|
%endif |
|
|
|
|
%if stereo || mx_stack_0_ %+ %%i |
|
|
|
|
fmaddps m0, m2, mx_0_ %+ %%i, m0, m2 |
|
|
|
|
FMULADD_PS m0, m2, mx_0_ %+ %%i, m0, m2 |
|
|
|
|
%else |
|
|
|
|
fmaddps m0, mx_0_ %+ %%i, [src_ptr+lenq], m0, m1 |
|
|
|
|
FMULADD_PS m0, mx_0_ %+ %%i, [src_ptr+lenq], m0, m1 |
|
|
|
|
%endif |
|
|
|
|
%assign %%i %%i+1 |
|
|
|
|
%endrep |
|
|
|
|