[FFmpeg-devel,03/10] checkasm: Add idctdsp add/put-pixels-clamped tests

Message ID	20220325185257.513933-4-bavison@riscosopen.org
State	New
Headers	show Delivered-To: ffmpegpatchwork2@gmail.com Received-SPF: pass (google.com: domain of ffmpeg-devel-bounces@ffmpeg.org designates 79.124.17.100 as permitted sender) client-ip=79.124.17.100; From: Ben Avison <bavison@riscosopen.org> To: ffmpeg-devel@ffmpeg.org Date: Fri, 25 Mar 2022 18:52:50 +0000 Message-Id: <20220325185257.513933-4-bavison@riscosopen.org> In-Reply-To: <20220325185257.513933-1-bavison@riscosopen.org> References: <20220317185819.466470-1-bavison@riscosopen.org> <20220325185257.513933-1-bavison@riscosopen.org> MIME-Version: 1.0 at: http://www.authsmtp.com/abuse Subject: [FFmpeg-devel] [PATCH 03/10] checkasm: Add idctdsp add/put-pixels-clamped tests Precedence: list Reply-To: FFmpeg development discussions and patches <ffmpeg-devel@ffmpeg.org> Cc: Ben Avison <bavison@riscosopen.org> Content-Type: text/plain; charset="us-ascii" Content-Transfer-Encoding: 7bit Errors-To: ffmpeg-devel-bounces@ffmpeg.org Sender: "ffmpeg-devel" <ffmpeg-devel-bounces@ffmpeg.org>
Series	avcodec/vc1: Arm optimisations \| expand [FFmpeg-devel,v2,00/10] avcodec/vc1: Arm optimisations [FFmpeg-devel,01/10] checkasm: Add vc1dsp in-loop deblocking filter tests [FFmpeg-devel,02/10] checkasm: Add vc1dsp inverse transform tests [FFmpeg-devel,03/10] checkasm: Add idctdsp add/put-pixels-clamped tests [FFmpeg-devel,04/10] avcodec/vc1: Introduce fast path for unescaping bitstream buffer [FFmpeg-devel,05/10] avcodec/vc1: Arm 64-bit NEON deblocking filter fast paths [FFmpeg-devel,06/10] avcodec/vc1: Arm 32-bit NEON deblocking filter fast paths [FFmpeg-devel,07/10] avcodec/vc1: Arm 64-bit NEON inverse transform fast paths [FFmpeg-devel,08/10] avcodec/idctdsp: Arm 64-bit NEON block add and clamp fast paths [FFmpeg-devel,09/10] avcodec/vc1: Arm 64-bit NEON unescape fast path [FFmpeg-devel,10/10] avcodec/vc1: Arm 32-bit NEON unescape fast path

Context	Check	Description
andriy/make_x86	success	Make finished
andriy/make_fate_x86	success	Make fate finished

diff --git a/libavcodec/arm/idctdsp_init_arm.c b/libavcodec/arm/idctdsp_init_arm.c index ebc90e4b49..8c8f7daf06 100644 --- a/libavcodec/arm/idctdsp_init_arm.c +++ b/libavcodec/arm/idctdsp_init_arm.c @@ -83,7 +83,9 @@ av_cold void ff_idctdsp_init_arm(IDCTDSPContext *c, AVCodecContext *avctx, } } +#if 0 // FIXME: this implementation fails checkasm test c->add_pixels_clamped = ff_add_pixels_clamped_arm; +#endif if (have_armv5te(cpu_flags)) ff_idctdsp_init_armv5te(c, avctx, high_bit_depth); diff --git a/tests/checkasm/Makefile b/tests/checkasm/Makefile index 7133a6ee66..f6b1008855 100644 --- a/tests/checkasm/Makefile +++ b/tests/checkasm/Makefile @@ -9,6 +9,7 @@ AVCODECOBJS-$(CONFIG_G722DSP) += g722dsp.o AVCODECOBJS-$(CONFIG_H264DSP) += h264dsp.o AVCODECOBJS-$(CONFIG_H264PRED) += h264pred.o AVCODECOBJS-$(CONFIG_H264QPEL) += h264qpel.o +AVCODECOBJS-$(CONFIG_IDCTDSP) += idctdsp.o AVCODECOBJS-$(CONFIG_LLVIDDSP) += llviddsp.o AVCODECOBJS-$(CONFIG_LLVIDENCDSP) += llviddspenc.o AVCODECOBJS-$(CONFIG_VC1DSP) += vc1dsp.o diff --git a/tests/checkasm/checkasm.c b/tests/checkasm/checkasm.c index c2efd81b6d..57134f96ea 100644 --- a/tests/checkasm/checkasm.c +++ b/tests/checkasm/checkasm.c @@ -123,6 +123,9 @@ static const struct { #if CONFIG_HUFFYUV_DECODER { "huffyuvdsp", checkasm_check_huffyuvdsp }, #endif + #if CONFIG_IDCTDSP + { "idctdsp", checkasm_check_idctdsp }, + #endif #if CONFIG_JPEG2000_DECODER { "jpeg2000dsp", checkasm_check_jpeg2000dsp }, #endif diff --git a/tests/checkasm/checkasm.h b/tests/checkasm/checkasm.h index 52ab18a5b1..a86db140e3 100644 --- a/tests/checkasm/checkasm.h +++ b/tests/checkasm/checkasm.h @@ -64,6 +64,7 @@ void checkasm_check_hevc_idct(void); void checkasm_check_hevc_pel(void); void checkasm_check_hevc_sao(void); void checkasm_check_huffyuvdsp(void); +void checkasm_check_idctdsp(void); void checkasm_check_jpeg2000dsp(void); void checkasm_check_llviddsp(void); void checkasm_check_llviddspenc(void); diff --git a/tests/checkasm/idctdsp.c b/tests/checkasm/idctdsp.c new file mode 100644 index 0000000000..d94728b672 --- /dev/null +++ b/tests/checkasm/idctdsp.c @@ -0,0 +1,85 @@ +/* + * Copyright (c) 2022 Ben Avison + * + * This file is part of FFmpeg. + * + * FFmpeg is free software; you can redistribute it and/or modify + * it under the terms of the GNU General Public License as published by + * the Free Software Foundation; either version 2 of the License, or + * (at your option) any later version. + * + * FFmpeg is distributed in the hope that it will be useful, + * but WITHOUT ANY WARRANTY; without even the implied warranty of + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the + * GNU General Public License for more details. + * + * You should have received a copy of the GNU General Public License along + * with FFmpeg; if not, write to the Free Software Foundation, Inc., + * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA. + */ + +#include <string.h> + +#include "checkasm.h" + +#include "libavcodec/idctdsp.h" + +#include "libavutil/common.h" +#include "libavutil/internal.h" +#include "libavutil/intreadwrite.h" +#include "libavutil/mem_internal.h" + +#define RANDOMIZE_BUFFER16(name, size) \ + do { \ + int i; \ + for (i = 0; i < size; ++i) { \ + uint16_t r = rnd(); \ + AV_WN16A(name##0 + i, r); \ + AV_WN16A(name##1 + i, r); \ + } \ + } while (0) + +#define RANDOMIZE_BUFFER8(name, size) \ + do { \ + int i; \ + for (i = 0; i < size; ++i) { \ + uint8_t r = rnd(); \ + name##0[i] = r; \ + name##1[i] = r; \ + } \ + } while (0) + +#define CHECK_ADD_PUT_CLAMPED(func) \ + do { \ + if (check_func(h.func, "idctdsp." #func)) { \ + declare_func_emms(AV_CPU_FLAG_MMX, void, const int16_t *, uint8_t *, ptrdiff_t); \ + RANDOMIZE_BUFFER16(src, 64); \ + RANDOMIZE_BUFFER8(dst, 10 * 24); \ + call_ref(src0, dst0 + 24 + 8, 24); \ + call_new(src1, dst1 + 24 + 8, 24); \ + if (memcmp(dst0, dst1, 10 * 24)) \ + fail(); \ + bench_new(src1, dst1 + 24 + 8, 24); \ + } \ + } while (0) + +void checkasm_check_idctdsp(void) +{ + /* Source buffers are only as big as needed, since any over-read won't affect results */ + LOCAL_ALIGNED_16(int16_t, src0, [64]); + LOCAL_ALIGNED_16(int16_t, src1, [64]); + /* Destination buffers have borders of one row above/below and 8 columns left/right to catch overflows */ + LOCAL_ALIGNED_8(uint8_t, dst0, [10 * 24]); + LOCAL_ALIGNED_8(uint8_t, dst1, [10 * 24]); + + AVCodecContext avctx = { 0 }; + IDCTDSPContext h; + + ff_idctdsp_init(&h, &avctx); + + CHECK_ADD_PUT_CLAMPED(add_pixels_clamped); + CHECK_ADD_PUT_CLAMPED(put_pixels_clamped); + CHECK_ADD_PUT_CLAMPED(put_signed_pixels_clamped); + + report("idctdsp"); +} diff --git a/tests/fate/checkasm.mak b/tests/fate/checkasm.mak index 99e6bb13c4..c6273db183 100644 --- a/tests/fate/checkasm.mak +++ b/tests/fate/checkasm.mak @@ -19,6 +19,7 @@ FATE_CHECKASM = fate-checkasm-aacpsdsp \ fate-checkasm-hevc_pel \ fate-checkasm-hevc_sao \ fate-checkasm-huffyuvdsp \ + fate-checkasm-idctdsp \ fate-checkasm-jpeg2000dsp \ fate-checkasm-llviddsp \ fate-checkasm-llviddspenc \

[FFmpeg-devel,03/10] checkasm: Add idctdsp add/put-pixels-clamped tests

Checks

Commit Message

Comments

Patch