@ -255,7 +255,7 @@ function ff_vp9_\txfm1\()_\txfm2\()_4x4_add_neon, export=1
cmp w3 , #1
b. n e 1 f
/ / DC- o n l y f o r i d c t / i d c t
ld1 r { v2 . 4 h } , [ x2 ]
ld1 { v2 . h } [ 0 ] , [ x2 ]
smull v2 . 4 s , v2 . 4 h , v0 . h [ 0 ]
rshrn v2 . 4 h , v2 . 4 s , #14
smull v2 . 4 s , v2 . 4 h , v0 . h [ 0 ]
@ -287,8 +287,8 @@ function ff_vp9_\txfm1\()_\txfm2\()_4x4_add_neon, export=1
\ txfm2 \ ( ) 4 v4 , v5 , v6 , v7
2 :
ld1 r { v0 . 2 s } , [ x0 ] , x1
ld1 r { v1 . 2 s } , [ x0 ] , x1
ld1 { v0 . s } [ 0 ] , [ x0 ] , x1
ld1 { v1 . s } [ 0 ] , [ x0 ] , x1
.ifnc \ txfm1 ,i w h t
srshr v4 . 4 h , v4 . 4 h , #4
srshr v5 . 4 h , v5 . 4 h , #4
@ -297,8 +297,8 @@ function ff_vp9_\txfm1\()_\txfm2\()_4x4_add_neon, export=1
.endif
uaddw v4 . 8 h , v4 . 8 h , v0 . 8 b
uaddw v5 . 8 h , v5 . 8 h , v1 . 8 b
ld1 r { v2 . 2 s } , [ x0 ] , x1
ld1 r { v3 . 2 s } , [ x0 ] , x1
ld1 { v2 . s } [ 0 ] , [ x0 ] , x1
ld1 { v3 . s } [ 0 ] , [ x0 ] , x1
sqxtun v0 . 8 b , v4 . 8 h
sqxtun v1 . 8 b , v5 . 8 h
sub x0 , x0 , x1 , l s l #2
@ -394,7 +394,7 @@ function ff_vp9_\txfm1\()_\txfm2\()_8x8_add_neon, export=1
cmp w3 , #1
b. n e 1 f
/ / DC- o n l y f o r i d c t / i d c t
ld1 r { v2 . 4 h } , [ x2 ]
ld1 { v2 . h } [ 0 ] , [ x2 ]
smull v2 . 4 s , v2 . 4 h , v0 . h [ 0 ]
rshrn v2 . 4 h , v2 . 4 s , #14
smull v2 . 4 s , v2 . 4 h , v0 . h [ 0 ]
@ -485,7 +485,7 @@ function idct16x16_dc_add_neon
movi v1 . 4 h , #0
ld1 r { v2 . 4 h } , [ x2 ]
ld1 { v2 . h } [ 0 ] , [ x2 ]
smull v2 . 4 s , v2 . 4 h , v0 . h [ 0 ]
rshrn v2 . 4 h , v2 . 4 s , #14
smull v2 . 4 s , v2 . 4 h , v0 . h [ 0 ]
@ -1044,7 +1044,7 @@ function idct32x32_dc_add_neon
movi v1 . 4 h , #0
ld1 r { v2 . 4 h } , [ x2 ]
ld1 { v2 . h } [ 0 ] , [ x2 ]
smull v2 . 4 s , v2 . 4 h , v0 . h [ 0 ]
rshrn v2 . 4 h , v2 . 4 s , #14
smull v2 . 4 s , v2 . 4 h , v0 . h [ 0 ]