Skip to Main Content

Close

Journals
Books
Case Studies
Collections
Open Access
Citation Manager

Journals
Books
Case Studies
Collections
Open Access
Citation Manager

header search

Search input auto suggest

filter your search

Advanced Search

Menu

Journal Home
Issues
Earlycite Articles

Issues

Select Year

Issue

Volume 14, Issue 1

9 October 2025

APSIPA Transactions on Signal and Information Processing Cover Image for Volume 14, Issue 1

Cover Image

Cover Image

ISSN 2048-7703

EISSN 2048-7703

In this Issue

Original Paper
Overview Paper

Original Paper

Serial-OE: Anomalous Sound Detection Based on Serial Method with Outlier Exposure Capable of Using Small Amounts of Anomalous Data for Training

Ibuki Kuroyanagi; Tomoki Hayashi; Kazuya Takeda; Tomoki Toda

View articletitled, Serial-OE: Anomalous Sound Detection Based on Serial Method with Outlier Exposure Capable of Using Small Amounts of Anomalous Data for Training

Open the PDF for in another window

Add to Citation Manager for Serial-OE: Anomalous Sound Detection Based on Serial Method with Outlier Exposure Capable of Using Small Amounts of Anomalous Data for Training

PSHop: A Lightweight Feed-Forward Method for 3D Prostate Gland Segmentation

Yijing Yang; Vasileios Magoulianitis; Jiaxin Yang; Jintang Xue; Masatomo Kaneko; Giovanni Cacciamani; Andre Abreu; Vinay Duddalwar; C.-C. Jay Kuo; Inderbir S. Gill; Chrysostomos Nikias

View articletitled, PSHop: A Lightweight Feed-Forward Method for 3D Prostate Gland Segmentation

Open the PDF for in another window

Add to Citation Manager for PSHop: A Lightweight Feed-Forward Method for 3D Prostate Gland Segmentation

Target Speaker Extraction under Noisy Underdetermined Conditions Using Conditional Variational Autoencoder, Global Style Token, and Neural Postfilter

Rui Wang; Takuya Fujimura; Tomoki Toda

View articletitled, Target Speaker Extraction under Noisy Underdetermined Conditions Using Conditional Variational Autoencoder, Global Style Token, and Neural Postfilter

Open the PDF for in another window

Add to Citation Manager for Target Speaker Extraction under Noisy Underdetermined Conditions Using Conditional Variational Autoencoder, Global Style Token, and Neural Postfilter

RTL Evaluation of ℓ₂-Norm Approximation with Rotated ℓ₁-Norm for 2-Tuple Arrays

Shu Abe; Yuya Kodama; Hiroyoshi Yamada; Shogo Muramatsu

View articletitled, RTL Evaluation of <em>ℓ</em><sub>2</sub>-Norm Approximation with Rotated <em>ℓ</em><sub>1</sub>-Norm for 2-Tuple Arrays

Open the PDF for in another window

Add to Citation Manager for RTL Evaluation of <em>ℓ</em><sub>2</sub>-Norm Approximation with Rotated <em>ℓ</em><sub>1</sub>-Norm for 2-Tuple Arrays

Unsupervised Pitch-Timbre-Variation Disentanglement of Monophonic Music Signals Based on Random Perturbation and Re-entry Training

Keitaro Tanaka; Kazuyoshi Yoshii; Simon Dixon; Shigeo Morishima

View articletitled, Unsupervised Pitch-Timbre-Variation Disentanglement of Monophonic Music Signals Based on Random Perturbation and Re-entry Training

Open the PDF for in another window

Add to Citation Manager for Unsupervised Pitch-Timbre-Variation Disentanglement of Monophonic Music Signals Based on Random Perturbation and Re-entry Training

Speech Emotion Recognition Using Sequences of Fine-grained Emotion Labels with Phoneme Class Attributes

Ryotaro Nagase; Takahiro Fukumori; Yoichi Yamashita

View articletitled, Speech Emotion Recognition Using Sequences of Fine-grained Emotion Labels with Phoneme Class Attributes

Open the PDF for in another window

Add to Citation Manager for Speech Emotion Recognition Using Sequences of Fine-grained Emotion Labels with Phoneme Class Attributes

Robust ICU Mortality Prediction with Multi-Task Diffusion and Contrastive Learning Frameworks

Namtip Buranaburustam; Wuttipong Kumwilaisak; Chatchawarn Hansakunbuntheung; Nattanun Thatphithakkul; Kanya Kumwilaisak

View articletitled, Robust ICU Mortality Prediction with Multi-Task Diffusion and Contrastive Learning Frameworks

Open the PDF for in another window

Add to Citation Manager for Robust ICU Mortality Prediction with Multi-Task Diffusion and Contrastive Learning Frameworks

Asymptotics of Proximity Operator for Squared Loss and Performance Prediction of Nonconvex Sparse Signal Recovery

Ryo Hayakawa

View articletitled, Asymptotics of Proximity Operator for Squared Loss and Performance Prediction of Nonconvex Sparse Signal Recovery

Open the PDF for in another window

Add to Citation Manager for Asymptotics of Proximity Operator for Squared Loss and Performance Prediction of Nonconvex Sparse Signal Recovery

Improvement of Sound Quality in Visual Microphone by Manipulation of Focused Area

Hayata Nakano; Yuting Geng; Kenta Iwai; Takanobu Nishiura

View articletitled, Improvement of Sound Quality in Visual Microphone by Manipulation of Focused Area

Open the PDF for in another window

Add to Citation Manager for Improvement of Sound Quality in Visual Microphone by Manipulation of Focused Area

Sequence-to-sequence Voice Conversion-based Techniques for Electrolaryngeal Speech Enhancement in Noisy and Reverberant Conditions

Ding Ma; Yeonjong Choi; Takuya Fujimura; Fengji Li; Chao Xie; Kazuhiro Kobayashi; Tomoki Toda

View articletitled, Sequence-to-sequence Voice Conversion-based Techniques for Electrolaryngeal Speech Enhancement in Noisy and Reverberant Conditions

Open the PDF for in another window

Add to Citation Manager for Sequence-to-sequence Voice Conversion-based Techniques for Electrolaryngeal Speech Enhancement in Noisy and Reverberant Conditions

Nested Frequency Diverse Array for Co-located MIMO Radar using Grid-free DOA and Range Estimation Method

Beizuo Zhu; Kazunori Hayashi; Hiroki Mori

View articletitled, Nested Frequency Diverse Array for Co-located MIMO Radar using Grid-free DOA and Range Estimation Method

Open the PDF for in another window

Add to Citation Manager for Nested Frequency Diverse Array for Co-located MIMO Radar using Grid-free DOA and Range Estimation Method

How Good is ChatGPT at Audiovisual Deepfake Detection: A Comparative Study of ChatGPT, AI Models and Human Perception

Sahibzada Adil Shahzad; Ammarah Hashmi; Yan-Tsung Peng; Yu Tsao; Hsin-Min Wang

View articletitled, How Good is ChatGPT at Audiovisual Deepfake Detection: A Comparative Study of ChatGPT, AI Models and Human Perception

Open the PDF for in another window

Add to Citation Manager for How Good is ChatGPT at Audiovisual Deepfake Detection: A Comparative Study of ChatGPT, AI Models and Human Perception

Text- and Speech-style Control for Lecture Speech Generation Focusing on Disfluency

Daiki Yoshioka; Yuuto Nakata; Yusuke Yasuda; Tomoki Toda

View articletitled, Text- and Speech-style Control for Lecture Speech Generation Focusing on Disfluency

Open the PDF for in another window

Add to Citation Manager for Text- and Speech-style Control for Lecture Speech Generation Focusing on Disfluency

Scene Understanding by Fused Hu’s Invariant Moments and Deep Learning Features

Michael Nachipyangu; Jiangbin Zheng

View articletitled, Scene Understanding by Fused Hu’s Invariant Moments and Deep Learning Features

Open the PDF for in another window

Add to Citation Manager for Scene Understanding by Fused Hu’s Invariant Moments and Deep Learning Features

An Investigation of Noisy-to-noisy Voice Conversion Performance in Various Noisy Conditions

Chao Xie; Tomoki Toda

View articletitled, An Investigation of Noisy-to-noisy Voice Conversion Performance in Various Noisy Conditions

Open the PDF for in another window

Add to Citation Manager for An Investigation of Noisy-to-noisy Voice Conversion Performance in Various Noisy Conditions

A Brain-inspired Multi-Detector Machine for Fake Speech Detection

Chang Feng; Xiaolong Wu; Mingxing Xu; Thomas Fang Zheng

View articletitled, A Brain-inspired Multi-Detector Machine for Fake Speech Detection

Open the PDF for in another window

Add to Citation Manager for A Brain-inspired Multi-Detector Machine for Fake Speech Detection

PPMamba: A Pyramid Pooling Local Auxiliary SSM-based Model for Remote Sensing Image Semantic Segmentation

Yin Hu; Xianping Ma; Jialu Sui; Man-On Pun

View articletitled, PPMamba: A Pyramid Pooling Local Auxiliary SSM-based Model for Remote Sensing Image Semantic Segmentation

Open the PDF for in another window

Add to Citation Manager for PPMamba: A Pyramid Pooling Local Auxiliary SSM-based Model for Remote Sensing Image Semantic Segmentation

Learning Separated Representations for Instrument-based Music Similarity

Yuka Hashizume; Li Li; Atsushi Miyashita; Tomoki Toda

View articletitled, Learning Separated Representations for Instrument-based Music Similarity

Open the PDF for in another window

Add to Citation Manager for Learning Separated Representations for Instrument-based Music Similarity

Improving Anomalous Sound Detection Through Pseudo-anomalous Set Selection and Pseudo-label Utilization Under Unlabeled Conditions

Ibuki Kuroyanagi; Takuya Fujimura; Kazuya Takeda; Tomoki Toda

View articletitled, Improving Anomalous Sound Detection Through Pseudo-anomalous Set Selection and Pseudo-label Utilization Under Unlabeled Conditions

Open the PDF for in another window

Add to Citation Manager for Improving Anomalous Sound Detection Through Pseudo-anomalous Set Selection and Pseudo-label Utilization Under Unlabeled Conditions

Analysis and Extension of Noisy-target Training for Unsupervised Target Signal Enhancement

Takuya Fujimura; Tomoki Toda

View articletitled, Analysis and Extension of Noisy-target Training for Unsupervised Target Signal Enhancement

Open the PDF for in another window

Add to Citation Manager for Analysis and Extension of Noisy-target Training for Unsupervised Target Signal Enhancement

Music Bleeding-sound Reduction Based on Time-channel Nonnegative Matrix Factorization

Yusaku Mizobuchi; Daichi Kitamura; Tomohiko Nakamura; Norihiro Takamune; Hiroshi Saruwatari; Yu Takahashi; Kazunobu Kondo

View articletitled, Music Bleeding-sound Reduction Based on Time-channel Nonnegative Matrix Factorization

Open the PDF for in another window

Add to Citation Manager for Music Bleeding-sound Reduction Based on Time-channel Nonnegative Matrix Factorization

Audio Difference Learning Framework for Audio Captioning

Tatsuya Komatsu; Kazuya Takeda; Tomoki Toda

View articletitled, Audio Difference Learning Framework for Audio Captioning

Open the PDF for in another window

Add to Citation Manager for Audio Difference Learning Framework for Audio Captioning

Time-domain Separation Priority Pipeline-based Cascaded Multi-task Learning for Monaural Noisy and Reverberant Speech Separation

Shaoxiang Dang; Tetsuya Matsumoto; Yoshinori Takeuchi; Hiroaki Kudo

View articletitled, Time-domain Separation Priority Pipeline-based Cascaded Multi-task Learning for Monaural Noisy and Reverberant Speech Separation

Open the PDF for in another window

Add to Citation Manager for Time-domain Separation Priority Pipeline-based Cascaded Multi-task Learning for Monaural Noisy and Reverberant Speech Separation

Multi-attribute Learning for Multi-level Emotion Recognition from Speech

Yuan Gao; Hao Shi; Chenhui Chu; Tatsuya Kawahara

View articletitled, Multi-attribute Learning for Multi-level Emotion Recognition from Speech

Open the PDF for in another window

Add to Citation Manager for Multi-attribute Learning for Multi-level Emotion Recognition from Speech

ASVSpoof 2021: Detecting Spoofed Utterances Through Hybrid Features

Ramesh K. Bhukya; Aditya Raj; Anshul Kumar

View articletitled, ASVSpoof 2021: Detecting Spoofed Utterances Through Hybrid Features

Open the PDF for in another window

Add to Citation Manager for ASVSpoof 2021: Detecting Spoofed Utterances Through Hybrid Features

MR-EEGWaveNet: Multiresolutional EEGWaveNet for Seizure Detection from Long EEG Recordings

Kazi Mahmudul Hassan; Xuyang Zhao; Hidenori Sugano; Toshihisa Tanaka

View articletitled, MR-EEGWaveNet: Multiresolutional EEGWaveNet for Seizure Detection from Long EEG Recordings

Open the PDF for in another window

Add to Citation Manager for MR-EEGWaveNet: Multiresolutional EEGWaveNet for Seizure Detection from Long EEG Recordings

Two-stage Pipeline for Automated Cell Segmentation: Integrating Semantic and Instance Learning

Thanh-Ha Do; Hoang Minh-Huong Dang; Thanh-Lam Tran; Van-De Nguyen

View articletitled, Two-stage Pipeline for Automated Cell Segmentation: Integrating Semantic and Instance Learning

Open the PDF for in another window

Add to Citation Manager for Two-stage Pipeline for Automated Cell Segmentation: Integrating Semantic and Instance Learning

Spatial Active Noise Control Based on Kernel Interpolation With Individual Directional Weighting

Kazuyuki Arikawa; Shoichi Koyama; Hiroshi Saruwatari

View articletitled, Spatial Active Noise Control Based on Kernel Interpolation With Individual Directional Weighting

Open the PDF for in another window

Add to Citation Manager for Spatial Active Noise Control Based on Kernel Interpolation With Individual Directional Weighting

Research and Standards in 3D Scene Description Technologies: A Survey

Dong-shin Lim; Dong-hun Lee; Dong-hwi Kim; Jeong-hun Hong; Aro Kim; Chae-yeong Song; Bosung Baek; Dabin Kang; Myeong-jin Jang; Jinwoo Jeong; Sungjei Kim; Sang-hyo Park

View articletitled, Research and Standards in 3D Scene Description Technologies: A Survey

Open the PDF for in another window

Add to Citation Manager for Research and Standards in 3D Scene Description Technologies: A Survey

Stabilizing and Enhancing Remixing-based Unsupervised Sound Source Separation

Kohei Saijo; Tetsuji Ogawa

View articletitled, Stabilizing and Enhancing Remixing-based Unsupervised Sound Source Separation

Open the PDF for in another window

Add to Citation Manager for Stabilizing and Enhancing Remixing-based Unsupervised Sound Source Separation

Target Speaker Extractor Training with Diverse Speaker Conditions and Synthetic Data

Yun Liu; Xuechen Liu; Xiaoxiao Miao; Junichi Yamagishi

View articletitled, Target Speaker Extractor Training with Diverse Speaker Conditions and Synthetic Data

Open the PDF for in another window

Add to Citation Manager for Target Speaker Extractor Training with Diverse Speaker Conditions and Synthetic Data

Estimation of Geometric Transformation Matrices Using Grid-shaped Pilot Signals

Rinka Kawano; Masaki Kawamura

View articletitled, Estimation of Geometric Transformation Matrices Using Grid-shaped Pilot Signals

Open the PDF for in another window

Add to Citation Manager for Estimation of Geometric Transformation Matrices Using Grid-shaped Pilot Signals

Joint Analysis of Acoustic Scenes and Sound Events Based on Semi-supervised Training of Sound Events With Partial Labels

Keisuke Imoto

View articletitled, Joint Analysis of Acoustic Scenes and Sound Events Based on Semi-supervised Training of Sound Events With Partial Labels

Open the PDF for in another window

Add to Citation Manager for Joint Analysis of Acoustic Scenes and Sound Events Based on Semi-supervised Training of Sound Events With Partial Labels

Overview Paper

Generative Coding: Promise and Challenges

Siwei Ma; Shenpeng Song; Bolin Chen; Qi Mao; Xiaohan Fang; Chuanmin Jia; Shiqi Wang

View articletitled, Generative Coding: Promise and Challenges

Open the PDF for in another window

Add to Citation Manager for Generative Coding: Promise and Challenges

New and popular articles

Latest
Most Read
Most Cited

Sum-rate maximization in OFDM system with practical model reconfigurable intelligent surfaces

Graph signal denoising using regularization by denoising and its parameter estimation

Non-autoregressive speech translation with understanding, translation, reordering and LLM-augmented correction

Radiograph super-resolution with pixel-level masked D-MNet transformer

Email alerts

Earlycite Alert

Closed Issue Alert

Latest Published Articles Alert

Recommended for you

These recommendations are informed by your reading behaviors and indicated interests.

RSS

Current Issue RSS Feed

Open Issues RSS Feed

About this Journal
Editorial Team
Write for this Journal
Author Guidelines

Online ISSN 2048-7703
Print ISSN 2048-7703

Bluesky
Facebook
LinkedIn
YouTube
Instagram

© 2025 Emerald Publishing Limited

Authors
Editors
Librarians
Researchers
Reviewers

Open Access
How-to Guides
Emerald Publishing Services

Contact us
Help
About Emerald
Working for Emerald

Cookie Policy
Accessibility
Site policies
Privacy notice
Modern Slavery Act
© 2025 Emerald Publishing Limited

This Feature Is Available To Subscribers Only

Sign In or Create an Account

Sharing Unavailable

Sharing content requires targeting cookies to be enabled. Please update your cookie preferences to use this feature.