@ -502,28 +502,27 @@ function ff_pred16x16_plane_neon_10, export=1
add v7 . 4 h , v7 . 4 h , v0 . 4 h
add v7 . 4 h , v7 . 4 h , v0 . 4 h
shl v2 . 4 h , v7 . 4 h , #4
shl v2 . 4 h , v7 . 4 h , #4
ssubl v2 . 4 s , v2 . 4 h , v3 . 4 h
ssubl v2 . 4 s , v2 . 4 h , v3 . 4 h
shl v3 . 4 h , v4 . 4 h , #4
ext v0 . 1 6 b , v0 . 1 6 b , v0 . 1 6 b , #14
ext v0 . 1 6 b , v0 . 1 6 b , v0 . 1 6 b , #14
ssubl v6 . 4 s , v5 . 4 h , v3 . 4 h
sxtl v6 . 4 s , v5 . 4 h / / c
mov v0 . h [ 0 ] , w z r
mov v0 . h [ 0 ] , w z r
mul v0 . 8 h , v0 . 8 h , v4 . h [ 0 ]
mul v0 . 8 h , v0 . 8 h , v4 . h [ 0 ]
dup v16 . 4 s , v2 . s [ 0 ]
dup v16 . 4 s , v2 . s [ 0 ]
dup v17 . 4 s , v2 . s [ 0 ]
dup v17 . 4 s , v2 . s [ 0 ]
dup v2 . 8 h , v4 . h [ 0 ]
dup v2 . 8 h , v4 . h [ 0 ] / / b
dup v3 . 4 s , v6 . s [ 0 ]
dup v3 . 4 s , v6 . s [ 0 ] / / c
shl v2 . 8 h , v2 . 8 h , #3
sshll v2 . 4 s , v2 . 4 h , #3 / / b * 8
saddw v16 . 4 s , v16 . 4 s , v0 . 4 h
saddw v16 . 4 s , v16 . 4 s , v0 . 4 h
saddw2 v17 . 4 s , v17 . 4 s , v0 . 8 h
saddw2 v17 . 4 s , v17 . 4 s , v0 . 8 h
saddw v3 . 4 s , v3 . 4 s , v2 . 4 h
sub v3 . 4 s , v3 . 4 s , v2 . 4 s
mov w3 , #16
mov w3 , #16
mvni v4 . 8 h , #0xFC , l s l #8 / / 1 0 2 3 f o r c l i p p i n g
mvni v4 . 8 h , #0xFC , l s l #8 / / 1 0 2 3 f o r c l i p p i n g
1 :
1 :
sqshrun v0 . 4 h , v16 . 4 s , #5
sqshrun v0 . 4 h , v16 . 4 s , #5
sqshrun2 v0 . 8 h , v17 . 4 s , #5
sqshrun2 v0 . 8 h , v17 . 4 s , #5
saddw v16 . 4 s , v16 . 4 s , v2 . 4 h
add v16 . 4 s , v16 . 4 s , v2 . 4 s
saddw v17 . 4 s , v17 . 4 s , v2 . 4 h
add v17 . 4 s , v17 . 4 s , v2 . 4 s
sqshrun v1 . 4 h , v16 . 4 s , #5
sqshrun v1 . 4 h , v16 . 4 s , #5
sqshrun2 v1 . 8 h , v17 . 4 s , #5
sqshrun2 v1 . 8 h , v17 . 4 s , #5
add v16 . 4 s , v16 . 4 s , v3 . 4 s
add v16 . 4 s , v16 . 4 s , v3 . 4 s