@ -34,7 +34,7 @@ void ff_h264_add_pixels4_8_mmi(uint8_t *dst, int16_t *src, int stride)
DECLARE_VAR_LOW32 ;
__asm__ volatile (
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
MMI_LDC1 ( % [ ftmp1 ] , % [ src ] , 0x00 )
MMI_LDC1 ( % [ ftmp2 ] , % [ src ] , 0x08 )
MMI_LDC1 ( % [ ftmp3 ] , % [ src ] , 0x10 )
@ -89,7 +89,7 @@ void ff_h264_idct_add_8_mmi(uint8_t *dst, int16_t *block, int stride)
MMI_LDC1 ( % [ ftmp2 ] , % [ block ] , 0x10 )
MMI_LDC1 ( % [ ftmp3 ] , % [ block ] , 0x18 )
/* memset(block, 0, 32) */
" xor %[ftmp4], %[ftmp4], %[ftmp4] \n \t "
" p xor %[ftmp4], %[ftmp4], %[ftmp4] \n \t "
" gssqc1 %[ftmp4], %[ftmp4], 0x00(%[block]) \n \t "
" gssqc1 %[ftmp4], %[ftmp4], 0x10(%[block]) \n \t "
" dli %[tmp0], 0x01 \n \t "
@ -127,7 +127,7 @@ void ff_h264_idct_add_8_mmi(uint8_t *dst, int16_t *block, int stride)
" psubh %[ftmp5], %[ftmp5], %[ftmp4] \n \t "
MMI_ULWC1 ( % [ ftmp2 ] , % [ dst ] , 0x00 )
MMI_LWXC1 ( % [ ftmp0 ] , % [ dst ] , % [ stride ] , 0x00 )
" xor %[ftmp7], %[ftmp7], %[ftmp7] \n \t "
" p xor %[ftmp7], %[ftmp7], %[ftmp7] \n \t "
" psrah %[ftmp3], %[ftmp10], %[ftmp9] \n \t "
" psrah %[ftmp4], %[ftmp11], %[ftmp9] \n \t "
" punpcklbh %[ftmp2], %[ftmp2], %[ftmp7] \n \t "
@ -419,7 +419,7 @@ void ff_h264_idct8_add_8_mmi(uint8_t *dst, int16_t *block, int stride)
" psubh %[ftmp7], %[ftmp7], %[ftmp1] \n \t "
MMI_SDC1 ( % [ ftmp0 ] , $ sp , 0x10 )
" dmfc1 %[tmp1], %[ftmp2] \n \t "
" xor %[ftmp2], %[ftmp2], %[ftmp2] \n \t "
" p xor %[ftmp2], %[ftmp2], %[ftmp2] \n \t "
MMI_SDC1 ( % [ ftmp2 ] , % [ block ] , 0x00 )
MMI_SDC1 ( % [ ftmp2 ] , % [ block ] , 0x08 )
MMI_SDC1 ( % [ ftmp2 ] , % [ block ] , 0x10 )
@ -555,7 +555,7 @@ void ff_h264_idct8_add_8_mmi(uint8_t *dst, int16_t *block, int stride)
" psubh %[ftmp3], %[ftmp3], %[ftmp4] \n \t "
MMI_SDC1 ( % [ ftmp7 ] , $ sp , 0x18 )
" dmfc1 %[tmp2], %[ftmp0] \n \t "
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
MMI_ULWC1 ( % [ ftmp6 ] , % [ addr0 ] , 0x00 )
MMI_LWXC1 ( % [ ftmp7 ] , % [ addr0 ] , % [ stride ] , 0x00 )
" psrah %[ftmp2], %[ftmp2], %[ftmp10] \n \t "
@ -646,7 +646,7 @@ void ff_h264_idct_dc_add_8_mmi(uint8_t *dst, int16_t *block, int stride)
__asm__ volatile (
" mtc1 %[dc], %[ftmp5] \n \t "
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" pshufh %[ftmp5], %[ftmp5], %[ftmp0] \n \t "
MMI_ULWC1 ( % [ ftmp1 ] , % [ dst0 ] , 0x00 )
MMI_ULWC1 ( % [ ftmp2 ] , % [ dst1 ] , 0x00 )
@ -690,7 +690,7 @@ void ff_h264_idct8_dc_add_8_mmi(uint8_t *dst, int16_t *block, int stride)
__asm__ volatile (
" mtc1 %[dc], %[ftmp5] \n \t "
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" pshufh %[ftmp5], %[ftmp5], %[ftmp0] \n \t "
MMI_LDC1 ( % [ ftmp1 ] , % [ dst0 ] , 0x00 )
MMI_LDC1 ( % [ ftmp2 ] , % [ dst1 ] , 0x00 )
@ -929,7 +929,7 @@ void ff_h264_luma_dc_dequant_idct_8_mmi(int16_t *output, int16_t *input,
" packsswh %[ftmp0], %[ftmp0], %[ftmp1] \n \t "
" packsswh %[ftmp2], %[ftmp2], %[ftmp5] \n \t "
" dmfc1 %[tmp1], %[ftmp0] \n \t "
" dsrl %[ftmp0], %[ftmp0], %[ftmp9] \n \t "
" ssrld %[ftmp0], %[ftmp0], %[ftmp9] \n \t "
" mfc1 %[input], %[ftmp0] \n \t "
" sh %[tmp1], 0x00(%[output]) \n \t "
" sh %[input], 0x80(%[output]) \n \t "
@ -938,7 +938,7 @@ void ff_h264_luma_dc_dequant_idct_8_mmi(int16_t *output, int16_t *input,
" sh %[tmp1], 0x20(%[output]) \n \t "
" sh %[input], 0xa0(%[output]) \n \t "
" dmfc1 %[tmp1], %[ftmp2] \n \t "
" dsrl %[ftmp2], %[ftmp2], %[ftmp9] \n \t "
" ssrld %[ftmp2], %[ftmp2], %[ftmp9] \n \t "
" mfc1 %[input], %[ftmp2] \n \t "
" sh %[tmp1], 0x40(%[output]) \n \t "
" sh %[input], 0xc0(%[output]) \n \t "
@ -963,7 +963,7 @@ void ff_h264_luma_dc_dequant_idct_8_mmi(int16_t *output, int16_t *input,
" packsswh %[ftmp3], %[ftmp3], %[ftmp1] \n \t "
" packsswh %[ftmp4], %[ftmp4], %[ftmp5] \n \t "
" dmfc1 %[tmp1], %[ftmp3] \n \t "
" dsrl %[ftmp3], %[ftmp3], %[ftmp9] \n \t "
" ssrld %[ftmp3], %[ftmp3], %[ftmp9] \n \t "
" mfc1 %[input], %[ftmp3] \n \t "
" sh %[tmp1], 0x100(%[output]) \n \t "
" sh %[input], 0x180(%[output]) \n \t "
@ -972,7 +972,7 @@ void ff_h264_luma_dc_dequant_idct_8_mmi(int16_t *output, int16_t *input,
" sh %[tmp1], 0x120(%[output]) \n \t "
" sh %[input], 0x1a0(%[output]) \n \t "
" dmfc1 %[tmp1], %[ftmp4] \n \t "
" dsrl %[ftmp4], %[ftmp4], %[ftmp9] \n \t "
" ssrld %[ftmp4], %[ftmp4], %[ftmp9] \n \t "
" mfc1 %[input], %[ftmp4] \n \t "
" sh %[tmp1], 0x140(%[output]) \n \t "
" sh %[input], 0x1c0(%[output]) \n \t "
@ -1016,7 +1016,7 @@ void ff_h264_luma_dc_dequant_idct_8_mmi(int16_t *output, int16_t *input,
" packsswh %[ftmp0], %[ftmp0], %[ftmp1] \n \t "
" packsswh %[ftmp2], %[ftmp2], %[ftmp5] \n \t "
" dmfc1 %[tmp1], %[ftmp0] \n \t "
" dsrl %[ftmp0], %[ftmp0], %[ftmp9] \n \t "
" ssrld %[ftmp0], %[ftmp0], %[ftmp9] \n \t "
" sh %[tmp1], 0x00(%[output]) \n \t "
" mfc1 %[input], %[ftmp0] \n \t "
" dsrl %[tmp1], %[tmp1], 0x10 \n \t "
@ -1025,7 +1025,7 @@ void ff_h264_luma_dc_dequant_idct_8_mmi(int16_t *output, int16_t *input,
PTR_SRL " %[input], %[input], 0x10 \n \t "
" dmfc1 %[tmp1], %[ftmp2] \n \t "
" sh %[input], 0xa0(%[output]) \n \t "
" dsrl %[ftmp2], %[ftmp2], %[ftmp9] \n \t "
" ssrld %[ftmp2], %[ftmp2], %[ftmp9] \n \t "
" sh %[tmp1], 0x40(%[output]) \n \t "
" mfc1 %[input], %[ftmp2] \n \t "
" dsrl %[tmp1], %[tmp1], 0x10 \n \t "
@ -1050,7 +1050,7 @@ void ff_h264_luma_dc_dequant_idct_8_mmi(int16_t *output, int16_t *input,
" packsswh %[ftmp3], %[ftmp3], %[ftmp1] \n \t "
" packsswh %[ftmp4], %[ftmp4], %[ftmp5] \n \t "
" dmfc1 %[tmp1], %[ftmp3] \n \t "
" dsrl %[ftmp3], %[ftmp3], %[ftmp9] \n \t "
" ssrld %[ftmp3], %[ftmp3], %[ftmp9] \n \t "
" mfc1 %[input], %[ftmp3] \n \t "
" sh %[tmp1], 0x100(%[output]) \n \t "
" sh %[input], 0x180(%[output]) \n \t "
@ -1059,7 +1059,7 @@ void ff_h264_luma_dc_dequant_idct_8_mmi(int16_t *output, int16_t *input,
" sh %[tmp1], 0x120(%[output]) \n \t "
" sh %[input], 0x1a0(%[output]) \n \t "
" dmfc1 %[tmp1], %[ftmp4] \n \t "
" dsrl %[ftmp4], %[ftmp4], %[ftmp9] \n \t "
" ssrld %[ftmp4], %[ftmp4], %[ftmp9] \n \t "
" mfc1 %[input], %[ftmp4] \n \t "
" sh %[tmp1], 0x140(%[output]) \n \t "
" sh %[input], 0x1c0(%[output]) \n \t "
@ -1144,7 +1144,7 @@ void ff_h264_weight_pixels16_8_mmi(uint8_t *block, ptrdiff_t stride, int height,
for ( y = 0 ; y < height ; y + + , block + = stride ) {
__asm__ volatile (
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
MMI_LDC1 ( % [ ftmp1 ] , % [ block0 ] , 0x00 )
MMI_LDC1 ( % [ ftmp2 ] , % [ block1 ] , 0x00 )
" mtc1 %[weight], %[ftmp3] \n \t "
@ -1198,7 +1198,7 @@ void ff_h264_biweight_pixels16_8_mmi(uint8_t *dst, uint8_t *src,
for ( y = 0 ; y < height ; y + + , dst + = stride , src + = stride ) {
__asm__ volatile (
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
MMI_LDC1 ( % [ ftmp1 ] , % [ src0 ] , 0x00 )
MMI_LDC1 ( % [ ftmp2 ] , % [ dst0 ] , 0x00 )
" mtc1 %[weights], %[ftmp3] \n \t "
@ -1271,7 +1271,7 @@ void ff_h264_weight_pixels8_8_mmi(uint8_t *block, ptrdiff_t stride, int height,
for ( y = 0 ; y < height ; y + + , block + = stride ) {
__asm__ volatile (
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
MMI_LDC1 ( % [ ftmp1 ] , % [ block ] , 0x00 )
" mtc1 %[weight], %[ftmp2] \n \t "
" mtc1 %[offset], %[ftmp3] \n \t "
@ -1312,7 +1312,7 @@ void ff_h264_biweight_pixels8_8_mmi(uint8_t *dst, uint8_t *src,
for ( y = 0 ; y < height ; y + + , dst + = stride , src + = stride ) {
__asm__ volatile (
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
MMI_LDC1 ( % [ ftmp1 ] , % [ src ] , 0x00 )
MMI_LDC1 ( % [ ftmp2 ] , % [ dst ] , 0x00 )
" mtc1 %[weights], %[ftmp3] \n \t "
@ -1366,7 +1366,7 @@ void ff_h264_weight_pixels4_8_mmi(uint8_t *block, ptrdiff_t stride, int height,
for ( y = 0 ; y < height ; y + + , block + = stride ) {
__asm__ volatile (
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
MMI_ULWC1 ( % [ ftmp1 ] , % [ block ] , 0x00 )
" mtc1 %[weight], %[ftmp2] \n \t "
" mtc1 %[offset], %[ftmp3] \n \t "
@ -1402,7 +1402,7 @@ void ff_h264_biweight_pixels4_8_mmi(uint8_t *dst, uint8_t *src,
for ( y = 0 ; y < height ; y + + , dst + = stride , src + = stride ) {
__asm__ volatile (
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
MMI_ULWC1 ( % [ ftmp1 ] , % [ src ] , 0x00 )
MMI_ULWC1 ( % [ ftmp2 ] , % [ dst ] , 0x00 )
" mtc1 %[weight], %[ftmp3] \n \t "
@ -1445,7 +1445,7 @@ void ff_deblock_v8_luma_8_mmi(uint8_t *pix, ptrdiff_t stride, int alpha, int bet
__asm__ volatile (
PTR_ADDU " %[addr0], %[stride], %[stride] \n \t "
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
PTR_ADDU " %[addr1], %[stride], %[addr0] \n \t "
" addi %[alpha], %[alpha], -0x01 \n \t "
PTR_SUBU " %[addr1], $0, %[addr1] \n \t "
@ -1463,18 +1463,18 @@ void ff_deblock_v8_luma_8_mmi(uint8_t *pix, ptrdiff_t stride, int alpha, int bet
" packushb %[ftmp6], %[ftmp6], %[ftmp6] \n \t "
" psubusb %[ftmp7], %[ftmp3], %[ftmp2] \n \t "
" psubusb %[ftmp8], %[ftmp2], %[ftmp3] \n \t "
" or %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" p or %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" psubusb %[ftmp7], %[ftmp2], %[ftmp1] \n \t "
" psubusb %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" psubusb %[ftmp5], %[ftmp1], %[ftmp2] \n \t "
" or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" p or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" psubusb %[ftmp7], %[ftmp3], %[ftmp4] \n \t "
" psubusb %[ftmp5], %[ftmp5], %[ftmp6] \n \t "
" or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" p or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" psubusb %[ftmp5], %[ftmp4], %[ftmp3] \n \t "
" or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" p or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" psubusb %[ftmp5], %[ftmp5], %[ftmp6] \n \t "
" or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" p or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" pcmpeqb %[ftmp8], %[ftmp8], %[ftmp0] \n \t "
" pcmpeqb %[ftmp4], %[ftmp4], %[ftmp4] \n \t "
MMI_ULWC1 ( % [ ftmp5 ] , % [ tc0 ] , 0x00 )
@ -1482,21 +1482,21 @@ void ff_deblock_v8_luma_8_mmi(uint8_t *pix, ptrdiff_t stride, int alpha, int bet
" punpcklbh %[ftmp9], %[ftmp5], %[ftmp5] \n \t "
" pcmpgtb %[ftmp5], %[ftmp9], %[ftmp4] \n \t "
MMI_LDC1 ( % [ ftmp4 ] , % [ addr1 ] , 0x00 )
" and %[ftmp10], %[ftmp5], %[ftmp8] \n \t "
" p and %[ftmp10], %[ftmp5], %[ftmp8] \n \t "
" psubusb %[ftmp8], %[ftmp4], %[ftmp2] \n \t "
" psubusb %[ftmp7], %[ftmp2], %[ftmp4] \n \t "
" psubusb %[ftmp8], %[ftmp8], %[ftmp6] \n \t "
" psubusb %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" pcmpeqb %[ftmp7], %[ftmp7], %[ftmp8] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" and %[ftmp5], %[ftmp10], %[ftmp9] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" p and %[ftmp5], %[ftmp10], %[ftmp9] \n \t "
" psubb %[ftmp8], %[ftmp5], %[ftmp7] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp5] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp5] \n \t "
" pavgb %[ftmp5], %[ftmp2], %[ftmp3] \n \t "
MMI_LDC1 ( % [ ftmp11 ] , % [ addr1 ] , 0x00 )
" pavgb %[ftmp4], %[ftmp4], %[ftmp5] \n \t "
" xor %[ftmp5], %[ftmp5], %[ftmp11] \n \t "
" and %[ftmp5], %[ftmp5], %[ff_pb_1] \n \t "
" p xor %[ftmp5], %[ftmp5], %[ftmp11] \n \t "
" p and %[ftmp5], %[ftmp5], %[ff_pb_1] \n \t "
" psubusb %[ftmp4], %[ftmp4], %[ftmp5] \n \t "
" psubusb %[ftmp5], %[ftmp1], %[ftmp7] \n \t "
" paddusb %[ftmp7], %[ftmp7], %[ftmp1] \n \t "
@ -1509,26 +1509,26 @@ void ff_deblock_v8_luma_8_mmi(uint8_t *pix, ptrdiff_t stride, int alpha, int bet
" psubusb %[ftmp4], %[ftmp4], %[ftmp6] \n \t "
" psubusb %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" pcmpeqb %[ftmp7], %[ftmp7], %[ftmp4] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" psubb %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" and %[ftmp6], %[ftmp9], %[ftmp7] \n \t "
" p and %[ftmp6], %[ftmp9], %[ftmp7] \n \t "
MMI_LDXC1 ( % [ ftmp4 ] , % [ pix ] , % [ stride ] , 0x00 )
" pavgb %[ftmp7], %[ftmp2], %[ftmp3] \n \t "
MMI_LDXC1 ( % [ ftmp11 ] , % [ pix ] , % [ addr0 ] , 0x00 )
" pavgb %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" xor %[ftmp7], %[ftmp7], %[ftmp11] \n \t "
" and %[ftmp7], %[ftmp7], %[ff_pb_1] \n \t "
" p xor %[ftmp7], %[ftmp7], %[ftmp11] \n \t "
" p and %[ftmp7], %[ftmp7], %[ff_pb_1] \n \t "
" psubusb %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" psubusb %[ftmp7], %[ftmp4], %[ftmp6] \n \t "
" paddusb %[ftmp6], %[ftmp6], %[ftmp4] \n \t "
" pmaxub %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" pminub %[ftmp5], %[ftmp5], %[ftmp6] \n \t "
MMI_SDXC1 ( % [ ftmp5 ] , % [ pix ] , % [ stride ] , 0x00 )
" xor %[ftmp6], %[ftmp2], %[ftmp3] \n \t "
" p xor %[ftmp6], %[ftmp2], %[ftmp3] \n \t "
" pcmpeqb %[ftmp5], %[ftmp5], %[ftmp5] \n \t "
" and %[ftmp6], %[ftmp6], %[ff_pb_1] \n \t "
" xor %[ftmp4], %[ftmp4], %[ftmp5] \n \t "
" xor %[ftmp5], %[ftmp5], %[ftmp2] \n \t "
" p and %[ftmp6], %[ftmp6], %[ff_pb_1] \n \t "
" p xor %[ftmp4], %[ftmp4], %[ftmp5] \n \t "
" p xor %[ftmp5], %[ftmp5], %[ftmp2] \n \t "
" pavgb %[ftmp4], %[ftmp4], %[ftmp1] \n \t "
" pavgb %[ftmp4], %[ftmp4], %[ff_pb_3] \n \t "
" pavgb %[ftmp5], %[ftmp5], %[ftmp3] \n \t "
@ -1574,12 +1574,12 @@ static void deblock_v8_luma_intra_8_mmi(uint8_t *pix, ptrdiff_t stride, int alph
__asm__ volatile (
" ori %[tmp0], $0, 0x01 \n \t "
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" mtc1 %[tmp0], %[ftmp9] \n \t "
PTR_SLL " %[addr0], %[stride], 0x02 \n \t "
PTR_ADDU " %[addr2], %[stride], %[stride] \n \t "
PTR_ADDIU " %[alpha], %[alpha], -0x01 \n \t "
PTR_SLL " %[ftmp11], %[ftmp9], %[ftmp9] \n \t "
" sslld %[ftmp11], %[ftmp9], %[ftmp9] \n \t "
" bltz %[alpha], 1f \n \t "
PTR_ADDU " %[addr1], %[addr2], %[stride] \n \t "
PTR_ADDIU " %[beta], %[beta], -0x01 \n \t "
@ -1598,20 +1598,20 @@ static void deblock_v8_luma_intra_8_mmi(uint8_t *pix, ptrdiff_t stride, int alph
" psubusb %[ftmp7], %[ftmp3], %[ftmp2] \n \t "
" psubusb %[ftmp8], %[ftmp2], %[ftmp3] \n \t "
" packushb %[ftmp6], %[ftmp6], %[ftmp6] \n \t "
" or %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" p or %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
MMI_SDC1 ( % [ ftmp5 ] , % [ stack ] , 0x10 )
" psubusb %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" psubusb %[ftmp7], %[ftmp2], %[ftmp1] \n \t "
" psubusb %[ftmp5], %[ftmp1], %[ftmp2] \n \t "
" or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" p or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" psubusb %[ftmp5], %[ftmp5], %[ftmp6] \n \t "
" or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" p or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" psubusb %[ftmp7], %[ftmp3], %[ftmp4] \n \t "
" psubusb %[ftmp5], %[ftmp4], %[ftmp3] \n \t "
" or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" p or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" psubusb %[ftmp5], %[ftmp5], %[ftmp6] \n \t "
" or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" xor %[ftmp7], %[ftmp7], %[ftmp7] \n \t "
" p or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" p xor %[ftmp7], %[ftmp7], %[ftmp7] \n \t "
MMI_LDC1 ( % [ ftmp5 ] , % [ stack ] , 0x10 )
" pcmpeqb %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" ldc1 %[ftmp10], %[ff_pb_1] \n \t "
@ -1624,14 +1624,14 @@ static void deblock_v8_luma_intra_8_mmi(uint8_t *pix, ptrdiff_t stride, int alph
" psubusb %[ftmp7], %[ftmp7], %[ftmp5] \n \t "
MMI_LDC1 ( % [ ftmp15 ] , % [ stack ] , 0x20 )
" pcmpeqb %[ftmp7], %[ftmp7], %[ftmp8] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp15] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp15] \n \t "
MMI_LDXC1 ( % [ ftmp15 ] , % [ addr0 ] , % [ stride ] , 0x00 )
" psubusb %[ftmp8], %[ftmp15], %[ftmp2] \n \t "
" psubusb %[ftmp5], %[ftmp2], %[ftmp15] \n \t "
" psubusb %[ftmp8], %[ftmp8], %[ftmp6] \n \t "
" psubusb %[ftmp5], %[ftmp5], %[ftmp6] \n \t "
" pcmpeqb %[ftmp5], %[ftmp5], %[ftmp8] \n \t "
" and %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" p and %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
MMI_LDXC1 ( % [ ftmp14 ] , % [ pix ] , % [ addr2 ] , 0x00 )
MMI_SDC1 ( % [ ftmp5 ] , % [ stack ] , 0x30 )
" psubusb %[ftmp8], %[ftmp14], %[ftmp3] \n \t "
@ -1639,7 +1639,7 @@ static void deblock_v8_luma_intra_8_mmi(uint8_t *pix, ptrdiff_t stride, int alph
" psubusb %[ftmp8], %[ftmp8], %[ftmp6] \n \t "
" psubusb %[ftmp5], %[ftmp5], %[ftmp6] \n \t "
" pcmpeqb %[ftmp5], %[ftmp5], %[ftmp8] \n \t "
" and %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" p and %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
MMI_SDC1 ( % [ ftmp5 ] , % [ stack ] , 0x40 )
" pavgb %[ftmp5], %[ftmp15], %[ftmp1] \n \t "
" pavgb %[ftmp6], %[ftmp2], %[ftmp3] \n \t "
@ -1652,36 +1652,36 @@ static void deblock_v8_luma_intra_8_mmi(uint8_t *pix, ptrdiff_t stride, int alph
MMI_SDC1 ( % [ ftmp7 ] , % [ stack ] , 0x00 )
" psrlh %[ftmp7], %[ftmp7], %[ftmp9] \n \t "
" pavgb %[ftmp7], %[ftmp7], %[ftmp0] \n \t "
" xor %[ftmp7], %[ftmp7], %[ftmp5] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" p xor %[ftmp7], %[ftmp7], %[ftmp5] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" psubb %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" pavgb %[ftmp6], %[ftmp15], %[ftmp4] \n \t "
" psubb %[ftmp7], %[ftmp15], %[ftmp4] \n \t "
" paddb %[ftmp8], %[ftmp8], %[ftmp8] \n \t "
" psubb %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" psubb %[ftmp6], %[ftmp6], %[ftmp7] \n \t "
MMI_LDC1 ( % [ ftmp13 ] , % [ stack ] , 0x10 )
" pavgb %[ftmp6], %[ftmp6], %[ftmp1] \n \t "
" psrlh %[ftmp8], %[ftmp8], %[ftmp11] \n \t "
" pavgb %[ftmp6], %[ftmp6], %[ftmp13] \n \t "
" pavgb %[ftmp8], %[ftmp8], %[ftmp0] \n \t "
" xor %[ftmp8], %[ftmp8], %[ftmp6] \n \t "
" and %[ftmp8], %[ftmp8], %[ftmp10] \n \t "
" p xor %[ftmp8], %[ftmp8], %[ftmp6] \n \t "
" p and %[ftmp8], %[ftmp8], %[ftmp10] \n \t "
" psubb %[ftmp6], %[ftmp6], %[ftmp8] \n \t "
" xor %[ftmp8], %[ftmp2], %[ftmp4] \n \t "
" p xor %[ftmp8], %[ftmp2], %[ftmp4] \n \t "
" pavgb %[ftmp7], %[ftmp2], %[ftmp4] \n \t "
" and %[ftmp8], %[ftmp8], %[ftmp10] \n \t "
" p and %[ftmp8], %[ftmp8], %[ftmp10] \n \t "
" psubb %[ftmp7], %[ftmp7], %[ftmp8] \n \t "
MMI_LDC1 ( % [ ftmp13 ] , % [ stack ] , 0x30 )
" pavgb %[ftmp7], %[ftmp7], %[ftmp1] \n \t "
MMI_LDC1 ( % [ ftmp12 ] , % [ stack ] , 0x20 )
" xor %[ftmp6], %[ftmp6], %[ftmp7] \n \t "
" xor %[ftmp7], %[ftmp7], %[ftmp2] \n \t "
" and %[ftmp6], %[ftmp6], %[ftmp13] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp12] \n \t "
" xor %[ftmp6], %[ftmp6], %[ftmp7] \n \t "
" xor %[ftmp6], %[ftmp6], %[ftmp2] \n \t "
" p xor %[ftmp6], %[ftmp6], %[ftmp7] \n \t "
" p xor %[ftmp7], %[ftmp7], %[ftmp2] \n \t "
" p and %[ftmp6], %[ftmp6], %[ftmp13] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp12] \n \t "
" p xor %[ftmp6], %[ftmp6], %[ftmp7] \n \t "
" p xor %[ftmp6], %[ftmp6], %[ftmp2] \n \t "
MMI_SDXC1 ( % [ ftmp6 ] , % [ addr0 ] , % [ addr1 ] , 0x00 )
MMI_LDC1 ( % [ ftmp6 ] , % [ addr0 ] , 0x00 )
" paddb %[ftmp7], %[ftmp15], %[ftmp6] \n \t "
@ -1692,16 +1692,16 @@ static void deblock_v8_luma_intra_8_mmi(uint8_t *pix, ptrdiff_t stride, int alph
" paddb %[ftmp7], %[ftmp7], %[ftmp12] \n \t "
" psrlh %[ftmp7], %[ftmp7], %[ftmp11] \n \t "
" pavgb %[ftmp7], %[ftmp7], %[ftmp0] \n \t "
" xor %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" p xor %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
MMI_LDC1 ( % [ ftmp12 ] , % [ stack ] , 0x30 )
" psubb %[ftmp6], %[ftmp6], %[ftmp7] \n \t "
" xor %[ftmp5], %[ftmp5], %[ftmp1] \n \t "
" xor %[ftmp6], %[ftmp6], %[ftmp15] \n \t "
" and %[ftmp5], %[ftmp5], %[ftmp12] \n \t "
" and %[ftmp6], %[ftmp6], %[ftmp12] \n \t "
" xor %[ftmp5], %[ftmp5], %[ftmp1] \n \t "
" xor %[ftmp6], %[ftmp6], %[ftmp15] \n \t "
" p xor %[ftmp5], %[ftmp5], %[ftmp1] \n \t "
" p xor %[ftmp6], %[ftmp6], %[ftmp15] \n \t "
" p and %[ftmp5], %[ftmp5], %[ftmp12] \n \t "
" p and %[ftmp6], %[ftmp6], %[ftmp12] \n \t "
" p xor %[ftmp5], %[ftmp5], %[ftmp1] \n \t "
" p xor %[ftmp6], %[ftmp6], %[ftmp15] \n \t "
MMI_SDXC1 ( % [ ftmp5 ] , % [ addr0 ] , % [ addr2 ] , 0x00 )
MMI_SDXC1 ( % [ ftmp6 ] , % [ addr0 ] , % [ stride ] , 0x00 )
" pavgb %[ftmp5], %[ftmp14], %[ftmp4] \n \t "
@ -1715,36 +1715,36 @@ static void deblock_v8_luma_intra_8_mmi(uint8_t *pix, ptrdiff_t stride, int alph
MMI_SDC1 ( % [ ftmp7 ] , % [ stack ] , 0x00 )
" psrlh %[ftmp7], %[ftmp7], %[ftmp9] \n \t "
" pavgb %[ftmp7], %[ftmp7], %[ftmp0] \n \t "
" xor %[ftmp7], %[ftmp7], %[ftmp5] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" p xor %[ftmp7], %[ftmp7], %[ftmp5] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" psubb %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" pavgb %[ftmp6], %[ftmp14], %[ftmp1] \n \t "
" paddb %[ftmp8], %[ftmp8], %[ftmp8] \n \t "
" psubb %[ftmp7], %[ftmp14], %[ftmp1] \n \t "
" psubb %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" psubb %[ftmp6], %[ftmp6], %[ftmp7] \n \t "
MMI_LDC1 ( % [ ftmp12 ] , % [ stack ] , 0x10 )
" pavgb %[ftmp6], %[ftmp6], %[ftmp4] \n \t "
" pavgb %[ftmp6], %[ftmp6], %[ftmp12] \n \t "
" psrlh %[ftmp8], %[ftmp8], %[ftmp11] \n \t "
" pavgb %[ftmp8], %[ftmp8], %[ftmp0] \n \t "
" xor %[ftmp8], %[ftmp8], %[ftmp6] \n \t "
" and %[ftmp8], %[ftmp8], %[ftmp10] \n \t "
" p xor %[ftmp8], %[ftmp8], %[ftmp6] \n \t "
" p and %[ftmp8], %[ftmp8], %[ftmp10] \n \t "
" psubb %[ftmp6], %[ftmp6], %[ftmp8] \n \t "
" xor %[ftmp8], %[ftmp3], %[ftmp1] \n \t "
" p xor %[ftmp8], %[ftmp3], %[ftmp1] \n \t "
" pavgb %[ftmp7], %[ftmp3], %[ftmp1] \n \t "
" and %[ftmp8], %[ftmp8], %[ftmp10] \n \t "
" p and %[ftmp8], %[ftmp8], %[ftmp10] \n \t "
MMI_LDC1 ( % [ ftmp12 ] , % [ stack ] , 0x40 )
" psubb %[ftmp7], %[ftmp7], %[ftmp8] \n \t "
MMI_LDC1 ( % [ ftmp13 ] , % [ stack ] , 0x20 )
" pavgb %[ftmp7], %[ftmp7], %[ftmp4] \n \t "
" xor %[ftmp6], %[ftmp6], %[ftmp7] \n \t "
" xor %[ftmp7], %[ftmp7], %[ftmp3] \n \t "
" and %[ftmp6], %[ftmp6], %[ftmp12] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp13] \n \t "
" xor %[ftmp6], %[ftmp6], %[ftmp7] \n \t "
" xor %[ftmp6], %[ftmp6], %[ftmp3] \n \t "
" p xor %[ftmp6], %[ftmp6], %[ftmp7] \n \t "
" p xor %[ftmp7], %[ftmp7], %[ftmp3] \n \t "
" p and %[ftmp6], %[ftmp6], %[ftmp12] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp13] \n \t "
" p xor %[ftmp6], %[ftmp6], %[ftmp7] \n \t "
" p xor %[ftmp6], %[ftmp6], %[ftmp3] \n \t "
MMI_SDC1 ( % [ ftmp6 ] , % [ pix ] , 0x00 )
MMI_LDXC1 ( % [ ftmp6 ] , % [ pix ] , % [ addr1 ] , 0x00 )
" paddb %[ftmp7], %[ftmp14], %[ftmp6] \n \t "
@ -1755,16 +1755,16 @@ static void deblock_v8_luma_intra_8_mmi(uint8_t *pix, ptrdiff_t stride, int alph
" paddb %[ftmp7], %[ftmp7], %[ftmp12] \n \t "
" psrlh %[ftmp7], %[ftmp7], %[ftmp11] \n \t "
" pavgb %[ftmp7], %[ftmp7], %[ftmp0] \n \t "
" xor %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
" p xor %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp10] \n \t "
MMI_LDC1 ( % [ ftmp12 ] , % [ stack ] , 0x40 )
" psubb %[ftmp6], %[ftmp6], %[ftmp7] \n \t "
" xor %[ftmp5], %[ftmp5], %[ftmp4] \n \t "
" xor %[ftmp6], %[ftmp6], %[ftmp14] \n \t "
" and %[ftmp5], %[ftmp5], %[ftmp12] \n \t "
" and %[ftmp6], %[ftmp6], %[ftmp12] \n \t "
" xor %[ftmp5], %[ftmp5], %[ftmp4] \n \t "
" xor %[ftmp6], %[ftmp6], %[ftmp14] \n \t "
" p xor %[ftmp5], %[ftmp5], %[ftmp4] \n \t "
" p xor %[ftmp6], %[ftmp6], %[ftmp14] \n \t "
" p and %[ftmp5], %[ftmp5], %[ftmp12] \n \t "
" p and %[ftmp6], %[ftmp6], %[ftmp12] \n \t "
" p xor %[ftmp5], %[ftmp5], %[ftmp4] \n \t "
" p xor %[ftmp6], %[ftmp6], %[ftmp14] \n \t "
MMI_SDXC1 ( % [ ftmp5 ] , % [ pix ] , % [ stride ] , 0x00 )
MMI_SDXC1 ( % [ ftmp6 ] , % [ pix ] , % [ addr2 ] , 0x00 )
" 1: \n \t "
@ -1808,7 +1808,7 @@ void ff_deblock_v_chroma_8_mmi(uint8_t *pix, ptrdiff_t stride, int alpha,
MMI_LDC1 ( % [ ftmp3 ] , % [ pix ] , 0x00 )
MMI_LDXC1 ( % [ ftmp4 ] , % [ pix ] , % [ stride ] , 0x00 )
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" mtc1 %[alpha], %[ftmp5] \n \t "
" mtc1 %[beta], %[ftmp6] \n \t "
" pshufh %[ftmp5], %[ftmp5], %[ftmp0] \n \t "
@ -1817,29 +1817,29 @@ void ff_deblock_v_chroma_8_mmi(uint8_t *pix, ptrdiff_t stride, int alpha,
" packushb %[ftmp6], %[ftmp6], %[ftmp6] \n \t "
" psubusb %[ftmp7], %[ftmp3], %[ftmp2] \n \t "
" psubusb %[ftmp8], %[ftmp2], %[ftmp3] \n \t "
" or %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" p or %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" psubusb %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" psubusb %[ftmp7], %[ftmp2], %[ftmp1] \n \t "
" psubusb %[ftmp5], %[ftmp1], %[ftmp2] \n \t "
" or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" p or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" psubusb %[ftmp5], %[ftmp5], %[ftmp6] \n \t "
" or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" p or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" psubusb %[ftmp7], %[ftmp3], %[ftmp4] \n \t "
" psubusb %[ftmp5], %[ftmp4], %[ftmp3] \n \t "
" or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" p or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" psubusb %[ftmp5], %[ftmp5], %[ftmp6] \n \t "
" or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" xor %[ftmp7], %[ftmp7], %[ftmp7] \n \t "
" p or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" p xor %[ftmp7], %[ftmp7], %[ftmp7] \n \t "
" pcmpeqb %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
MMI_ULWC1 ( % [ ftmp7 ] , % [ tc0 ] , 0x00 )
" punpcklbh %[ftmp7], %[ftmp7], %[ftmp7] \n \t "
" and %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" p and %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" pcmpeqb %[ftmp5], %[ftmp5], %[ftmp5] \n \t "
" xor %[ftmp6], %[ftmp2], %[ftmp3] \n \t "
" xor %[ftmp4], %[ftmp4], %[ftmp5] \n \t "
" and %[ftmp6], %[ftmp6], %[ff_pb_1] \n \t "
" p xor %[ftmp6], %[ftmp2], %[ftmp3] \n \t "
" p xor %[ftmp4], %[ftmp4], %[ftmp5] \n \t "
" p and %[ftmp6], %[ftmp6], %[ff_pb_1] \n \t "
" pavgb %[ftmp4], %[ftmp4], %[ftmp1] \n \t "
" xor %[ftmp5], %[ftmp5], %[ftmp2] \n \t "
" p xor %[ftmp5], %[ftmp5], %[ftmp2] \n \t "
" pavgb %[ftmp4], %[ftmp4], %[ff_pb_3] \n \t "
" pavgb %[ftmp5], %[ftmp5], %[ftmp3] \n \t "
" pavgb %[ftmp4], %[ftmp4], %[ftmp6] \n \t "
@ -1891,7 +1891,7 @@ void ff_deblock_v_chroma_intra_8_mmi(uint8_t *pix, ptrdiff_t stride, int alpha,
MMI_LDC1 ( % [ ftmp3 ] , % [ pix ] , 0x00 )
MMI_LDXC1 ( % [ ftmp4 ] , % [ pix ] , % [ stride ] , 0x00 )
" xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" p xor %[ftmp0], %[ftmp0], %[ftmp0] \n \t "
" mtc1 %[alpha], %[ftmp5] \n \t "
" mtc1 %[beta], %[ftmp6] \n \t "
" pshufh %[ftmp5], %[ftmp5], %[ftmp0] \n \t "
@ -1900,36 +1900,36 @@ void ff_deblock_v_chroma_intra_8_mmi(uint8_t *pix, ptrdiff_t stride, int alpha,
" packushb %[ftmp6], %[ftmp6], %[ftmp6] \n \t "
" psubusb %[ftmp7], %[ftmp3], %[ftmp2] \n \t "
" psubusb %[ftmp8], %[ftmp2], %[ftmp3] \n \t "
" or %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" p or %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" psubusb %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" psubusb %[ftmp7], %[ftmp2], %[ftmp1] \n \t "
" psubusb %[ftmp5], %[ftmp1], %[ftmp2] \n \t "
" or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" p or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" psubusb %[ftmp5], %[ftmp5], %[ftmp6] \n \t "
" or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" p or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" psubusb %[ftmp7], %[ftmp3], %[ftmp4] \n \t "
" psubusb %[ftmp5], %[ftmp4], %[ftmp3] \n \t "
" or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" p or %[ftmp5], %[ftmp5], %[ftmp7] \n \t "
" psubusb %[ftmp5], %[ftmp5], %[ftmp6] \n \t "
" or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" xor %[ftmp7], %[ftmp7], %[ftmp7] \n \t "
" p or %[ftmp8], %[ftmp8], %[ftmp5] \n \t "
" p xor %[ftmp7], %[ftmp7], %[ftmp7] \n \t "
" pcmpeqb %[ftmp8], %[ftmp8], %[ftmp7] \n \t "
" mov.d %[ftmp6], %[ftmp2] \n \t "
" mov.d %[ftmp7], %[ftmp3] \n \t "
" xor %[ftmp5], %[ftmp2], %[ftmp4] \n \t "
" and %[ftmp5], %[ftmp5], %[ff_pb_1] \n \t "
" p xor %[ftmp5], %[ftmp2], %[ftmp4] \n \t "
" p and %[ftmp5], %[ftmp5], %[ff_pb_1] \n \t "
" pavgb %[ftmp2], %[ftmp2], %[ftmp4] \n \t "
" psubusb %[ftmp2], %[ftmp2], %[ftmp5] \n \t "
" pavgb %[ftmp2], %[ftmp2], %[ftmp1] \n \t "
" xor %[ftmp5], %[ftmp3], %[ftmp1] \n \t "
" and %[ftmp5], %[ftmp5], %[ff_pb_1] \n \t "
" p xor %[ftmp5], %[ftmp3], %[ftmp1] \n \t "
" p and %[ftmp5], %[ftmp5], %[ff_pb_1] \n \t "
" pavgb %[ftmp3], %[ftmp3], %[ftmp1] \n \t "
" psubusb %[ftmp3], %[ftmp3], %[ftmp5] \n \t "
" pavgb %[ftmp3], %[ftmp3], %[ftmp4] \n \t "
" psubb %[ftmp2], %[ftmp2], %[ftmp6] \n \t "
" psubb %[ftmp3], %[ftmp3], %[ftmp7] \n \t "
" and %[ftmp2], %[ftmp2], %[ftmp8] \n \t "
" and %[ftmp3], %[ftmp3], %[ftmp8] \n \t "
" p and %[ftmp2], %[ftmp2], %[ftmp8] \n \t "
" p and %[ftmp3], %[ftmp3], %[ftmp8] \n \t "
" paddb %[ftmp2], %[ftmp2], %[ftmp6] \n \t "
" paddb %[ftmp3], %[ftmp3], %[ftmp7] \n \t "
@ -1996,7 +1996,7 @@ void ff_deblock_h_chroma_8_mmi(uint8_t *pix, ptrdiff_t stride, int alpha, int be
" mov.d %[ftmp9], %[ftmp0] \n \t "
" mov.d %[ftmp10], %[ftmp3] \n \t "
" xor %[ftmp8], %[ftmp8], %[ftmp8] \n \t "
" p xor %[ftmp8], %[ftmp8], %[ftmp8] \n \t "
" mtc1 %[alpha], %[ftmp4] \n \t "
" mtc1 %[beta], %[ftmp5] \n \t "
" pshufh %[ftmp4], %[ftmp4], %[ftmp8] \n \t "
@ -2005,29 +2005,29 @@ void ff_deblock_h_chroma_8_mmi(uint8_t *pix, ptrdiff_t stride, int alpha, int be
" packushb %[ftmp5], %[ftmp5], %[ftmp5] \n \t "
" psubusb %[ftmp6], %[ftmp2], %[ftmp1] \n \t "
" psubusb %[ftmp7], %[ftmp1], %[ftmp2] \n \t "
" or %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" p or %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" psubusb %[ftmp7], %[ftmp7], %[ftmp4] \n \t "
" psubusb %[ftmp6], %[ftmp1], %[ftmp0] \n \t "
" psubusb %[ftmp4], %[ftmp0], %[ftmp1] \n \t "
" or %[ftmp4], %[ftmp4], %[ftmp6] \n \t "
" p or %[ftmp4], %[ftmp4], %[ftmp6] \n \t "
" psubusb %[ftmp4], %[ftmp4], %[ftmp5] \n \t "
" or %[ftmp7], %[ftmp7], %[ftmp4] \n \t "
" p or %[ftmp7], %[ftmp7], %[ftmp4] \n \t "
" psubusb %[ftmp6], %[ftmp2], %[ftmp3] \n \t "
" psubusb %[ftmp4], %[ftmp3], %[ftmp2] \n \t "
" or %[ftmp4], %[ftmp4], %[ftmp6] \n \t "
" p or %[ftmp4], %[ftmp4], %[ftmp6] \n \t "
" psubusb %[ftmp4], %[ftmp4], %[ftmp5] \n \t "
" or %[ftmp7], %[ftmp7], %[ftmp4] \n \t "
" xor %[ftmp6], %[ftmp6], %[ftmp6] \n \t "
" p or %[ftmp7], %[ftmp7], %[ftmp4] \n \t "
" p xor %[ftmp6], %[ftmp6], %[ftmp6] \n \t "
" pcmpeqb %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
MMI_ULWC1 ( % [ ftmp6 ] , % [ tc0 ] , 0x00 )
" punpcklbh %[ftmp6], %[ftmp6], %[ftmp6] \n \t "
" and %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" p and %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" pcmpeqb %[ftmp4], %[ftmp4], %[ftmp4] \n \t "
" xor %[ftmp5], %[ftmp1], %[ftmp2] \n \t "
" xor %[ftmp3], %[ftmp3], %[ftmp4] \n \t "
" and %[ftmp5], %[ftmp5], %[ff_pb_1] \n \t "
" p xor %[ftmp5], %[ftmp1], %[ftmp2] \n \t "
" p xor %[ftmp3], %[ftmp3], %[ftmp4] \n \t "
" p and %[ftmp5], %[ftmp5], %[ff_pb_1] \n \t "
" pavgb %[ftmp3], %[ftmp3], %[ftmp0] \n \t "
" xor %[ftmp4], %[ftmp4], %[ftmp1] \n \t "
" p xor %[ftmp4], %[ftmp4], %[ftmp1] \n \t "
" pavgb %[ftmp3], %[ftmp3], %[ff_pb_3] \n \t "
" pavgb %[ftmp4], %[ftmp4], %[ftmp2] \n \t "
" pavgb %[ftmp3], %[ftmp3], %[ftmp5] \n \t "
@ -2134,7 +2134,7 @@ void ff_deblock_h_chroma_intra_8_mmi(uint8_t *pix, ptrdiff_t stride, int alpha,
" punpcklwd %[ftmp0], %[ftmp0], %[ftmp4] \n \t "
" punpcklwd %[ftmp2], %[ftmp2], %[ftmp6] \n \t "
" xor %[ftmp8], %[ftmp8], %[ftmp8] \n \t "
" p xor %[ftmp8], %[ftmp8], %[ftmp8] \n \t "
" mtc1 %[alpha], %[ftmp4] \n \t "
" mtc1 %[beta], %[ftmp5] \n \t "
" pshufh %[ftmp4], %[ftmp4], %[ftmp8] \n \t "
@ -2143,36 +2143,36 @@ void ff_deblock_h_chroma_intra_8_mmi(uint8_t *pix, ptrdiff_t stride, int alpha,
" packushb %[ftmp5], %[ftmp5], %[ftmp5] \n \t "
" psubusb %[ftmp6], %[ftmp2], %[ftmp1] \n \t "
" psubusb %[ftmp7], %[ftmp1], %[ftmp2] \n \t "
" or %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" p or %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" psubusb %[ftmp7], %[ftmp7], %[ftmp4] \n \t "
" psubusb %[ftmp6], %[ftmp1], %[ftmp0] \n \t "
" psubusb %[ftmp4], %[ftmp0], %[ftmp1] \n \t "
" or %[ftmp4], %[ftmp4], %[ftmp6] \n \t "
" p or %[ftmp4], %[ftmp4], %[ftmp6] \n \t "
" psubusb %[ftmp4], %[ftmp4], %[ftmp5] \n \t "
" or %[ftmp7], %[ftmp7], %[ftmp4] \n \t "
" p or %[ftmp7], %[ftmp7], %[ftmp4] \n \t "
" psubusb %[ftmp6], %[ftmp2], %[ftmp3] \n \t "
" psubusb %[ftmp4], %[ftmp3], %[ftmp2] \n \t "
" or %[ftmp4], %[ftmp4], %[ftmp6] \n \t "
" p or %[ftmp4], %[ftmp4], %[ftmp6] \n \t "
" psubusb %[ftmp4], %[ftmp4], %[ftmp5] \n \t "
" or %[ftmp7], %[ftmp7], %[ftmp4] \n \t "
" xor %[ftmp6], %[ftmp6], %[ftmp6] \n \t "
" p or %[ftmp7], %[ftmp7], %[ftmp4] \n \t "
" p xor %[ftmp6], %[ftmp6], %[ftmp6] \n \t "
" pcmpeqb %[ftmp7], %[ftmp7], %[ftmp6] \n \t "
" mov.d %[ftmp5], %[ftmp1] \n \t "
" mov.d %[ftmp6], %[ftmp2] \n \t "
" xor %[ftmp4], %[ftmp1], %[ftmp3] \n \t "
" and %[ftmp4], %[ftmp4], %[ff_pb_1] \n \t "
" p xor %[ftmp4], %[ftmp1], %[ftmp3] \n \t "
" p and %[ftmp4], %[ftmp4], %[ff_pb_1] \n \t "
" pavgb %[ftmp1], %[ftmp1], %[ftmp3] \n \t "
" psubusb %[ftmp1], %[ftmp1], %[ftmp4] \n \t "
" pavgb %[ftmp1], %[ftmp1], %[ftmp0] \n \t "
" xor %[ftmp4], %[ftmp2], %[ftmp0] \n \t "
" and %[ftmp4], %[ftmp4], %[ff_pb_1] \n \t "
" p xor %[ftmp4], %[ftmp2], %[ftmp0] \n \t "
" p and %[ftmp4], %[ftmp4], %[ff_pb_1] \n \t "
" pavgb %[ftmp2], %[ftmp2], %[ftmp0] \n \t "
" psubusb %[ftmp2], %[ftmp2], %[ftmp4] \n \t "
" pavgb %[ftmp2], %[ftmp2], %[ftmp3] \n \t "
" psubb %[ftmp1], %[ftmp1], %[ftmp5] \n \t "
" psubb %[ftmp2], %[ftmp2], %[ftmp6] \n \t "
" and %[ftmp1], %[ftmp1], %[ftmp7] \n \t "
" and %[ftmp2], %[ftmp2], %[ftmp7] \n \t "
" p and %[ftmp1], %[ftmp1], %[ftmp7] \n \t "
" p and %[ftmp2], %[ftmp2], %[ftmp7] \n \t "
" paddb %[ftmp1], %[ftmp1], %[ftmp5] \n \t "
" paddb %[ftmp2], %[ftmp2], %[ftmp6] \n \t "