@ -1040,7 +1040,7 @@ function \txfm\()16_1d_4x16_pass1_neon
.irp i, 1 6 , 2 0 , 2 4 , 2 8 , 1 7 , 2 1 , 2 5 , 2 9 , 1 8 , 2 2 , 2 6 , 3 0 , 1 9 , 2 3 , 2 7 , 3 1
store \ i , x0 , #16
.endr
br x14
ret x14
1 :
/ / Special c a s e : F o r t h e l a s t i n p u t c o l u m n ( x1 = = 1 2 ) ,
/ / which w o u l d b e s t o r e d a s t h e l a s t r o w i n t h e t e m p b u f f e r ,
@ -1068,7 +1068,7 @@ function \txfm\()16_1d_4x16_pass1_neon
mov v29 . 1 6 b , v17 . 1 6 b
mov v30 . 1 6 b , v18 . 1 6 b
mov v31 . 1 6 b , v19 . 1 6 b
br x14
ret x14
endfunc
/ / Read a v e r t i c a l 4 x16 s l i c e o u t o f a 1 6 x16 m a t r i x , d o a t r a n s f o r m o n i t ,
@ -1098,7 +1098,7 @@ function \txfm\()16_1d_4x16_pass2_neon
load_ a d d _ s t o r e v16 . 4 s , v17 . 4 s , v18 . 4 s , v19 . 4 s , v20 . 4 s , v21 . 4 s , v22 . 4 s , v23 . 4 s
load_ a d d _ s t o r e v24 . 4 s , v25 . 4 s , v26 . 4 s , v27 . 4 s , v28 . 4 s , v29 . 4 s , v30 . 4 s , v31 . 4 s
br x14
ret x14
endfunc
.endm
@ -1208,7 +1208,7 @@ function vp9_\txfm1\()_\txfm2\()_16x16_add_16_neon
ldp d12 , d13 , [ s p ] , 0 x10
ldp d14 , d15 , [ s p ] , 0 x10
.endif
br x15
ret x15
endfunc
function f f _ v p9 _ \ t x f m 1 \ ( ) _ \ t x f m 2 \ ( ) _ 1 6 x16 _ a d d _ 1 0 _ n e o n , e x p o r t =1
@ -1264,7 +1264,7 @@ function idct16_1d_4x16_pass1_quarter_neon
st1 { v23 . 4 s } , [ x0 ] , #16
st1 { v27 . 4 s } , [ x0 ] , #16
st1 { v31 . 4 s } , [ x0 ] , #16
br x14
ret x14
endfunc
function i d c t 1 6 _ 1 d _ 4 x16 _ p a s s2 _ q u a r t e r _ n e o n
@ -1286,7 +1286,7 @@ function idct16_1d_4x16_pass2_quarter_neon
load_ a d d _ s t o r e v16 . 4 s , v17 . 4 s , v18 . 4 s , v19 . 4 s , v20 . 4 s , v21 . 4 s , v22 . 4 s , v23 . 4 s
load_ a d d _ s t o r e v24 . 4 s , v25 . 4 s , v26 . 4 s , v27 . 4 s , v28 . 4 s , v29 . 4 s , v30 . 4 s , v31 . 4 s
br x14
ret x14
endfunc
function i d c t 1 6 _ 1 d _ 4 x16 _ p a s s1 _ h a l f _ n e o n
@ -1313,7 +1313,7 @@ function idct16_1d_4x16_pass1_half_neon
.irp i, 1 6 , 2 0 , 2 4 , 2 8 , 1 7 , 2 1 , 2 5 , 2 9 , 1 8 , 2 2 , 2 6 , 3 0 , 1 9 , 2 3 , 2 7 , 3 1
store \ i , x0 , #16
.endr
br x14
ret x14
1 :
/ / Special c a s e : F o r t h e s e c o n d i n p u t c o l u m n ( r1 = = 4 ) ,
/ / which w o u l d b e s t o r e d a s t h e s e c o n d r o w i n t h e t e m p b u f f e r ,
@ -1341,7 +1341,7 @@ function idct16_1d_4x16_pass1_half_neon
mov v21 . 1 6 b , v17 . 1 6 b
mov v22 . 1 6 b , v18 . 1 6 b
mov v23 . 1 6 b , v19 . 1 6 b
br x14
ret x14
endfunc
function i d c t 1 6 _ 1 d _ 4 x16 _ p a s s2 _ h a l f _ n e o n
@ -1364,7 +1364,7 @@ function idct16_1d_4x16_pass2_half_neon
load_ a d d _ s t o r e v16 . 4 s , v17 . 4 s , v18 . 4 s , v19 . 4 s , v20 . 4 s , v21 . 4 s , v22 . 4 s , v23 . 4 s
load_ a d d _ s t o r e v24 . 4 s , v25 . 4 s , v26 . 4 s , v27 . 4 s , v28 . 4 s , v29 . 4 s , v30 . 4 s , v31 . 4 s
br x14
ret x14
endfunc
.macro idct16_partial size
@ -1390,7 +1390,7 @@ function idct16x16_\size\()_add_16_neon
add s p , s p , #1024
ldp d8 , d9 , [ s p ] , 0 x10
br x15
ret x15
endfunc
.endm
@ -1729,7 +1729,7 @@ function idct32_1d_4x32_pass1\suffix\()_neon
store_ r e v v29 . 4 s , v25 . 4 s , v21 . 4 s , v17 . 4 s , v29 . 1 6 b , v25 . 1 6 b
store_ r e v v28 . 4 s , v24 . 4 s , v20 . 4 s , v16 . 4 s , v28 . 1 6 b , v24 . 1 6 b
.purgem store_rev
br x14
ret x14
endfunc
/ / This i s m o s t l y t h e s a m e a s 4 x32 _ p a s s1 , b u t w i t h o u t t h e t r a n s p o s e ,
@ -1849,7 +1849,7 @@ function idct32_1d_4x32_pass2\suffix\()_neon
load_ a c c _ s t o r e v24 . 4 s , v25 . 4 s , v26 . 4 s , v27 . 4 s , 1
load_ a c c _ s t o r e v28 . 4 s , v29 . 4 s , v30 . 4 s , v31 . 4 s , 1
.purgem load_acc_store
br x14
ret x14
endfunc
.endm
@ -1943,7 +1943,7 @@ function vp9_idct_idct_32x32_add_16_neon
ldp d10 , d11 , [ s p ] , 0 x10
ldp d8 , d9 , [ s p ] , 0 x10
br x15
ret x15
endfunc
function f f _ v p9 _ i d c t _ i d c t _ 3 2 x32 _ a d d _ 1 0 _ n e o n , e x p o r t =1
@ -2009,7 +2009,7 @@ function idct32x32_\size\()_add_16_neon
ldp d10 , d11 , [ s p ] , 0 x10
ldp d8 , d9 , [ s p ] , 0 x10
br x15
ret x15
endfunc
.endm