[FFmpeg-devel,10/31] lavu/floatdsp: RISC-V V vector_fmul

Message ID	20220926145251.56351-10-remi@remlab.net
State	Accepted
Commit	7058af9969b737adbb1cd302cf8fa5feb7bc9e2b
Headers	show Delivered-To: ffmpegpatchwork2@gmail.com Received-SPF: pass (google.com: domain of ffmpeg-devel-bounces@ffmpeg.org designates 79.124.17.100 as permitted sender) client-ip=79.124.17.100; From: remi@remlab.net To: ffmpeg-devel@ffmpeg.org Date: Mon, 26 Sep 2022 17:52:30 +0300 Message-Id: <20220926145251.56351-10-remi@remlab.net> In-Reply-To: <5862173.lOV4Wx5bFT@basile.remlab.net> References: <5862173.lOV4Wx5bFT@basile.remlab.net> MIME-Version: 1.0 Subject: [FFmpeg-devel] [PATCH 10/31] lavu/floatdsp: RISC-V V vector_fmul Precedence: list Reply-To: FFmpeg development discussions and patches <ffmpeg-devel@ffmpeg.org> Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: base64 Errors-To: ffmpeg-devel-bounces@ffmpeg.org Sender: "ffmpeg-devel" <ffmpeg-devel-bounces@ffmpeg.org>
Series	initial RISC-V CPU extensions \| expand [FFmpeg-devel,PATCHv6,00/31] initial RISC-V CPU extensions [FFmpeg-devel,01/31] lavu/cpu: detect RISC-V base extensions [FFmpeg-devel,02/31] lavu/riscv: initial common header for assembler macros [FFmpeg-devel,03/31] lavc/audiodsp: RISC-V F vector_clipf [FFmpeg-devel,04/31] lavc/pixblockdsp: RISC-V I get_pixels [FFmpeg-devel,05/31] lavu/cpu: CPU flags for the RISC-V Vector extension [FFmpeg-devel,06/31] configure: probe RISC-V Vector extension [FFmpeg-devel,07/31] lavu/riscv: fallback macros for SH{1, 2, 3}ADD [FFmpeg-devel,08/31] lavu/floatdsp: RISC-V V vector_fmul_scalar [FFmpeg-devel,09/31] lavu/floatdsp: RISC-V V vector_dmul_scalar [FFmpeg-devel,10/31] lavu/floatdsp: RISC-V V vector_fmul [FFmpeg-devel,11/31] lavu/floatdsp: RISC-V V vector_dmul [FFmpeg-devel,12/31] lavu/floatdsp: RISC-V V vector_fmac_scalar [FFmpeg-devel,13/31] lavu/floatdsp: RISC-V V vector_dmac_scalar [FFmpeg-devel,14/31] lavu/floatdsp: RISC-V V vector_fmul_add [FFmpeg-devel,15/31] lavu/floatdsp: RISC-V V butterflies_float [FFmpeg-devel,16/31] lavu/floatdsp: RISC-V V vector_fmul_reverse [FFmpeg-devel,17/31] lavu/floatdsp: RISC-V V vector_fmul_window [FFmpeg-devel,18/31] lavu/floatdsp: RISC-V V scalarproduct_float [FFmpeg-devel,19/31] lavu/fixeddsp: RISC-V V butterflies_fixed [FFmpeg-devel,20/31] lavc/audiodsp: RISC-V V vector_clip_int32 [FFmpeg-devel,21/31] lavc/audiodsp: RISC-V V vector_clipf [FFmpeg-devel,22/31] lavc/audiodsp: RISC-V V scalarproduct_int16 [FFmpeg-devel,23/31] lavc/fmtconvert: RISC-V V int32_to_float_fmul_scalar [FFmpeg-devel,24/31] lavc/fmtconvert: RISC-V V int32_to_float_fmul_array8 [FFmpeg-devel,25/31] lavc/vorbisdsp: RISC-V V inverse_coupling [FFmpeg-devel,26/31] lavc/aacpsdsp: RISC-V V add_squares [FFmpeg-devel,27/31] lavc/aacpsdsp: RISC-V V mul_pair_single [FFmpeg-devel,28/31] lavc/aacpsdsp: RISC-V V hybrid_analysis [FFmpeg-devel,29/31] lavc/aacpsdsp: RISC-V V hybrid_analysis_ileave [FFmpeg-devel,30/31] lavc/aacpsdsp: RISC-V V hybrid_synthesis_deint [FFmpeg-devel,31/31] lavc/aacpsdsp: RISC-V V stereo_interpolate[0]

Message ID

20220926145251.56351-10-remi@remlab.net

State

Accepted

Commit

7058af9969b737adbb1cd302cf8fa5feb7bc9e2b

Headers

Received-SPF: pass (google.com: domain of ffmpeg-devel-bounces@ffmpeg.org
 designates 79.124.17.100 as permitted sender) client-ip=79.124.17.100;
From: remi@remlab.net
To: ffmpeg-devel@ffmpeg.org
Date: Mon, 26 Sep 2022 17:52:30 +0300
Message-Id: <20220926145251.56351-10-remi@remlab.net>
In-Reply-To: <5862173.lOV4Wx5bFT@basile.remlab.net>
References: <5862173.lOV4Wx5bFT@basile.remlab.net>
MIME-Version: 1.0
Subject: [FFmpeg-devel] [PATCH 10/31] lavu/floatdsp: RISC-V V vector_fmul
Precedence: list
Reply-To: FFmpeg development discussions and patches <ffmpeg-devel@ffmpeg.org>
Content-Type: text/plain; charset="utf-8"
Content-Transfer-Encoding: base64
Errors-To: ffmpeg-devel-bounces@ffmpeg.org
Sender: "ffmpeg-devel" <ffmpeg-devel-bounces@ffmpeg.org>

Series

initial RISC-V CPU extensions | expand

Checks

Context	Check	Description
yinshiyou/make_loongarch64	success	Make finished
yinshiyou/make_fate_loongarch64	success	Make fate finished
andriy/make_x86	success	Make finished
andriy/make_fate_x86	success	Make fate finished

Context

Check

Description

yinshiyou/make_loongarch64

success

Make finished

yinshiyou/make_fate_loongarch64

success

Make fate finished

andriy/make_x86

success

Make finished

andriy/make_fate_x86

success

Make fate finished

Commit Message

Rémi Denis-Courmont Sept. 26, 2022, 2:52 p.m. UTC

From: Rémi Denis-Courmont <remi@remlab.net>

---
 libavutil/riscv/float_dsp_init.c |  6 +++++-
 libavutil/riscv/float_dsp_rvv.S  | 17 +++++++++++++++++
 2 files changed, 22 insertions(+), 1 deletion(-)

diff --git a/libavutil/riscv/float_dsp_init.c b/libavutil/riscv/float_dsp_init.c
index 3386139d49..2482094ab4 100644
--- a/libavutil/riscv/float_dsp_init.c
+++ b/libavutil/riscv/float_dsp_init.c
@@ -25,6 +25,8 @@ 
 #include "libavutil/cpu.h"
 #include "libavutil/float_dsp.h"
 
+void ff_vector_fmul_rvv(float *dst, const float *src0, const float *src1,
+                         int len);
 void ff_vector_fmul_scalar_rvv(float *dst, const float *src, float mul,
                                 int len);
 
@@ -36,8 +38,10 @@  av_cold void ff_float_dsp_init_riscv(AVFloatDSPContext *fdsp)
 #if HAVE_RVV
     int flags = av_get_cpu_flags();
 
-    if (flags & AV_CPU_FLAG_RVV_F32)
+    if (flags & AV_CPU_FLAG_RVV_F32) {
+        fdsp->vector_fmul = ff_vector_fmul_rvv;
         fdsp->vector_fmul_scalar = ff_vector_fmul_scalar_rvv;
+    }
 
     if (flags & AV_CPU_FLAG_RVV_F64)
         fdsp->vector_dmul_scalar = ff_vector_dmul_scalar_rvv;
diff --git a/libavutil/riscv/float_dsp_rvv.S b/libavutil/riscv/float_dsp_rvv.S
index 17dda471b4..00fb7354bb 100644
--- a/libavutil/riscv/float_dsp_rvv.S
+++ b/libavutil/riscv/float_dsp_rvv.S
@@ -21,6 +21,23 @@ 
 #include "config.h"
 #include "asm.S"
 
+// (a0) = (a1) * (a2) [0..a3-1]
+func ff_vector_fmul_rvv, zve32f
+1:
+        vsetvli  t0, a3, e32, m1, ta, ma
+        vle32.v  v16, (a1)
+        sub      a3, a3, t0
+        vle32.v  v24, (a2)
+        sh2add   a1, t0, a1
+        vfmul.vv v16, v16, v24
+        sh2add   a2, t0, a2
+        vse32.v  v16, (a0)
+        sh2add   a0, t0, a0
+        bnez     a3, 1b
+
+        ret
+endfunc
+
 // (a0) = (a1) * fa0 [0..a2-1]
 func ff_vector_fmul_scalar_rvv, zve32f
 NOHWF   fmv.w.x  fa0, a2

[FFmpeg-devel,10/31] lavu/floatdsp: RISC-V V vector_fmul

Checks

Commit Message

Patch