[FFmpeg-devel] vfilter: Speed up vf_mutiply with inlining

Message ID	20230414210810.47688-1-surajshirvankar@gmail.com
State	New
Headers	show Delivered-To: ffmpegpatchwork2@gmail.com Received-SPF: pass (google.com: domain of ffmpeg-devel-bounces@ffmpeg.org designates 79.124.17.100 as permitted sender) client-ip=79.124.17.100; From: Suraj Shirvankar <surajshirvankar@gmail.com> To: ffmpeg-devel@ffmpeg.org Date: Fri, 14 Apr 2023 23:08:10 +0200 Message-Id: <20230414210810.47688-1-surajshirvankar@gmail.com> MIME-Version: 1.0 Subject: [FFmpeg-devel] [PATCH] vfilter: Speed up vf_mutiply with inlining Precedence: list Reply-To: FFmpeg development discussions and patches <ffmpeg-devel@ffmpeg.org> Cc: Suraj Shirvankar <surajshirvankar@gmail.com> Content-Type: text/plain; charset="us-ascii" Content-Transfer-Encoding: 7bit Errors-To: ffmpeg-devel-bounces@ffmpeg.org Sender: "ffmpeg-devel" <ffmpeg-devel-bounces@ffmpeg.org>
Series	[FFmpeg-devel] vfilter: Speed up vf_mutiply with inlining \| expand [FFmpeg-devel] vfilter: Speed up vf_mutiply with inlining

Message ID

20230414210810.47688-1-surajshirvankar@gmail.com

State

New

Headers

Received-SPF: pass (google.com: domain of ffmpeg-devel-bounces@ffmpeg.org
 designates 79.124.17.100 as permitted sender) client-ip=79.124.17.100;
From: Suraj Shirvankar <surajshirvankar@gmail.com>
To: ffmpeg-devel@ffmpeg.org
Date: Fri, 14 Apr 2023 23:08:10 +0200
Message-Id: <20230414210810.47688-1-surajshirvankar@gmail.com>
MIME-Version: 1.0
Subject: [FFmpeg-devel] [PATCH] vfilter: Speed up vf_mutiply with inlining
Precedence: list
Reply-To: FFmpeg development discussions and patches <ffmpeg-devel@ffmpeg.org>
Cc: Suraj Shirvankar <surajshirvankar@gmail.com>
Content-Type: text/plain; charset="us-ascii"
Content-Transfer-Encoding: 7bit
Errors-To: ffmpeg-devel-bounces@ffmpeg.org
Sender: "ffmpeg-devel" <ffmpeg-devel-bounces@ffmpeg.org>

Series

[FFmpeg-devel] vfilter: Speed up vf_mutiply with inlining | expand

Context	Check	Description
andriy/make_x86	success	Make finished
andriy/make_fate_x86	success	Make fate finished

Context

Check

Description

andriy/make_x86

success

Make finished

andriy/make_fate_x86

success

Make fate finished

Add inline to provide a slight speed up fo vf_multiply Signed-off-by: Suraj Shirvankar <surajshirvankar@gmail.com> --- libavfilter/vf_multiply.c | 9 ++++----- 1 file changed, 4 insertions(+), 5 deletions(-)

Comments

Ronald S. Bultje April 14, 2023, 11:32 p.m. UTC | #1

Hi,

On Fri, Apr 14, 2023 at 5:08 PM Suraj Shirvankar <surajshirvankar@gmail.com>
wrote:

> Add inline to provide a slight speed up fo vf_multiply
>
> Signed-off-by: Suraj Shirvankar <surajshirvankar@gmail.com>
> ---
>  libavfilter/vf_multiply.c | 9 ++++-----
>  1 file changed, 4 insertions(+), 5 deletions(-)
>
> diff --git a/libavfilter/vf_multiply.c b/libavfilter/vf_multiply.c
> index 979b885eb1..b9ff92d8e1 100644
> --- a/libavfilter/vf_multiply.c
> +++ b/libavfilter/vf_multiply.c
> @@ -72,9 +72,8 @@ static int config_input(AVFilterLink *inlink)
>      return 0;
>  }
>
> -static void multiply(const uint8_t *ssrc, const uint8_t *rref, uint8_t
> *ddst,
> -                     float scale, float offset, int w)
> -{
> +static inline void multiply(const uint8_t *ssrc, const uint8_t *rref,
> +                            uint8_t *ddst, float scale, float offset, int
> w) {
>      const float *src = (const float *)ssrc;
>      const float *ref = (const float *)rref;
>      float *dst = (float *)ddst;
>

Please provide performance measurements to justify the change. Wouldn't it
be better to write SIMD?


> @@ -86,8 +85,8 @@ static void multiply(const uint8_t *ssrc, const uint8_t
> *rref, uint8_t *ddst,
>      }
>  }
>
> -static int multiply_slice(AVFilterContext *ctx, void *arg, int jobnr, int
> nb_jobs)
> -{
> +static inline int multiply_slice(AVFilterContext *ctx, void *arg, int
> jobnr,
> +                                 int nb_jobs) {
>      MultiplyContext *s = ctx->priv;
>      const float offset = s->offset;
>      const float scale = s->scale;
>

This does nothing, since the function pointer is passed to
ff_filter_execute().

Ronald

Suraj Shirvankar April 15, 2023, 6:22 a.m. UTC | #2

Hi Ronald

On Sat, Apr 15, 2023, 1:33 AM Ronald S. Bultje <rsbultje@gmail.com> wrote:

> Hi,
>
> On Fri, Apr 14, 2023 at 5:08 PM Suraj Shirvankar <
> surajshirvankar@gmail.com> wrote:
>
>> Add inline to provide a slight speed up fo vf_multiply
>>
>> Signed-off-by: Suraj Shirvankar <surajshirvankar@gmail.com>
>> ---
>>  libavfilter/vf_multiply.c | 9 ++++-----
>>  1 file changed, 4 insertions(+), 5 deletions(-)
>>
>> diff --git a/libavfilter/vf_multiply.c b/libavfilter/vf_multiply.c
>> index 979b885eb1..b9ff92d8e1 100644
>> --- a/libavfilter/vf_multiply.c
>> +++ b/libavfilter/vf_multiply.c
>> @@ -72,9 +72,8 @@ static int config_input(AVFilterLink *inlink)
>>      return 0;
>>  }
>>
>> -static void multiply(const uint8_t *ssrc, const uint8_t *rref, uint8_t
>> *ddst,
>> -                     float scale, float offset, int w)
>> -{
>> +static inline void multiply(const uint8_t *ssrc, const uint8_t *rref,
>> +                            uint8_t *ddst, float scale, float offset,
>> int w) {
>>      const float *src = (const float *)ssrc;
>>      const float *ref = (const float *)rref;
>>      float *dst = (float *)ddst;
>>
>
> Please provide performance measurements to justify the change. Wouldn't it
> be better to write SIMD?
>

I agree it would make more sense to use the SIMD version. Will attach
relative performance improvement.


>
>> @@ -86,8 +85,8 @@ static void multiply(const uint8_t *ssrc, const uint8_t
>> *rref, uint8_t *ddst,
>>      }
>>  }
>>
>> -static int multiply_slice(AVFilterContext *ctx, void *arg, int jobnr,
>> int nb_jobs)
>> -{
>> +static inline int multiply_slice(AVFilterContext *ctx, void *arg, int
>> jobnr,
>> +                                 int nb_jobs) {
>>      MultiplyContext *s = ctx->priv;
>>      const float offset = s->offset;
>>      const float scale = s->scale;
>>
>
> This does nothing, since the function pointer is passed to
> ff_filter_execute().
>

Ah yes my bad, will remove this change.

>
> Ronald
>

diff --git a/libavfilter/vf_multiply.c b/libavfilter/vf_multiply.c
index 979b885eb1..b9ff92d8e1 100644
--- a/libavfilter/vf_multiply.c
+++ b/libavfilter/vf_multiply.c
@@ -72,9 +72,8 @@  static int config_input(AVFilterLink *inlink)
     return 0;
 }
 
-static void multiply(const uint8_t *ssrc, const uint8_t *rref, uint8_t *ddst,
-                     float scale, float offset, int w)
-{
+static inline void multiply(const uint8_t *ssrc, const uint8_t *rref,
+                            uint8_t *ddst, float scale, float offset, int w) {
     const float *src = (const float *)ssrc;
     const float *ref = (const float *)rref;
     float *dst = (float *)ddst;
@@ -86,8 +85,8 @@  static void multiply(const uint8_t *ssrc, const uint8_t *rref, uint8_t *ddst,
     }
 }
 
-static int multiply_slice(AVFilterContext *ctx, void *arg, int jobnr, int nb_jobs)
-{
+static inline int multiply_slice(AVFilterContext *ctx, void *arg, int jobnr,
+                                 int nb_jobs) {
     MultiplyContext *s = ctx->priv;
     const float offset = s->offset;
     const float scale = s->scale;

[FFmpeg-devel] vfilter: Speed up vf_mutiply with inlining

Checks

Commit Message

Comments

Patch