Multimedia Systems 1/2024

Regular Paper

SwinCT: feature enhancement based low-dose CT images denoising with swin transformer

Muwei Jian, Xiaoyang Yu, Haoran Zhang, Chengdong Yang

Regular Paper

Improving the application performance of Loki via algorithm optimization

Wenming Zhu, Wenjing Su, Kai Yang, Hao Chen

Special Issue Paper

Yolov5s-MSD: a multi-scale ship detector for visible video image

Yan-Tong Chen, Yan-Yan Zhang, Jia-Liang Wang, Yang Liu

Regular Paper

An automatic music generation method based on RSCLN_Transformer network

Yumei Zhang, Xiaojiao Lv, Qi Li, Xiaojun Wu, Yuping Su, Honghong Yang

Regular Paper

Occluded pedestrian re-identification via Res-ViT double-branch hybrid network

Yunbin Zhao, Songhao Zhu

Regular Paper

Rendering acceleration based on JND-guided sampling prediction

Ripei Zhang, Chunyi Chen, Zhongye Shen, Jun Peng, Minghui Ma

Regular Paper

Tensorial multi-view subspace clustering with side constraints for elevator security warning

Huangzhen Xu, Licheng Ruan, Yuzhou Ni, Hongwei Yin, Ping Yu, Xinmin Cheng

Regular Paper

Multi-label neural architecture search for chest radiography image classification

Yi Yang, Jiaxuan Wei, Zhixuan Yu, Ruisheng Zhang

Regular Paper

Frequency disentangled residual network

Satya Rajendra Singh, Roshan Reddy Yedla, Shiv Ram Dubey, Rakesh Kumar Sanodiya, Wei-Ta Chu

Regular Paper

Balanced sentimental information via multimodal interaction model

Yuanyi Luo, Rui Wu, Jiafeng Liu, Xianglong Tang

Regular Paper

Dy-MIL: dynamic multiple-instance learning framework for video anomaly detection

Chen Li, Mo Chen

Regular Paper

Underwater acoustic target recognition based on knowledge distillation under working conditions mismatching

Shuang Yang, Anqi Jin, Xiangyang Zeng, Haitao Wang, Xi Hong, Menghui Lei

Regular Paper

Facial expression intensity estimation using label-distribution-learning-enhanced ordinal regression

Ruyi Xu, Zhun Wang, Jingying Chen, Longpu Zhou

Regular Paper

Video question answering via traffic knowledge database and question classification

Xiaoyong Sun, Yu Dai, Yuchen Wang, Weifeng Ma, Xuefen Lin

Regular Paper

A real-time camera-based gaze-tracking system involving dual interactive modes and its application in gaming

He Zhang, Lu Yin, Hanling Zhang

Regular Paper

SV2-SQL: a text-to-SQL transformation mechanism based on BERT models for slot filling, value extraction, and verification

Chih-Yung Chang, Yuan-Lin Liang, Shih-Jung Wu, Diptendu Sinha Roy

Regular Paper

Universal unsupervised cross-domain 3D shape retrieval

Heyu Zhou, Fan Wang, Qipei Liu, Jiayu Li, Wen Liu, Xuanya Li, An-An Liu

Regular Paper

AF-FPN: an attention-guided enhanced feature pyramid network for breakwater armor layer unit segmentation

Linchun Gao, Shoujun Wang, Songgui Chen, Yuanye Hu

Regular Paper

DiffuseRoll: multi-track multi-attribute music generation based on diffusion model

Hongfei Wang, Yi Zou, Haonan Cheng, Long Ye

Regular Paper

Learning scale-aware relationships via Laplacian decomposition-based transformer for 3D human pose estimation

Jeonghwan Kim, Hyukmin Kwon, Seong Yong Lim, Wonjun Kim

Open Access Regular Paper

ITrans: generative image inpainting with transformers

Wei Miao, Lijun Wang, Huchuan Lu, Kaining Huang, Xinchu Shi, Bocong Liu

Regular Paper

A novel hashing-inverted index for secure content-based retrieval with massive encrypted speeches

Yingjie Hu, Qiuyu Zhang, Qiwen Zhang, Yugui Jia

Regular Paper

Coarse registration of point cloud base on deep local extremum detection and attentive description

Haotian Lu, Jianhui Nie

Regular Paper

Enhanced 3D reconstruction with all-neighbor-first philosophy and Ricci flow-based mesh smoothing approach

Mriganka Sarmah, Arambam Neelima

Open Access Regular Paper

AI and data-driven media analysis of TV content for optimised digital content marketing

Lyndon Nixon, Konstantinos Apostolidis, Evlampios Apostolidis, Damianos Galanopoulos, Vasileios Mezaris, Basil Philipp, Rasa Bocyte

Regular Paper

Underwater image enhancement method based on a cross attention mechanism

Sunhan Xu, Jinhua Wang, Ning He, Xin Hu, Fengxi Sun

Regular Paper

A plug-and-play image enhancement model for end-to-end object detection in low-light condition

Jiaojiao Yuan, Yongli Hu, Yanfeng Sun, Boyue Wang, Baocai Yin

Regular Paper

A simple spatial domain method for quality evaluation of blurred images

Md Amir Baig, Athar A. Moinuddin, E. Khan

Regular Paper

Event log anomaly detection method based on auto-encoder and control flow

Daoyu Kan, Xianwen Fang

Regular Paper

NDAM-YOLOseg: a real-time instance segmentation model based on multi-head attention mechanism

Chengang Dong, Yuhao Tang, Liyan Zhang

Regular Paper

Generalizing to unseen domains via PatchMix

Juncheng Yang, Zuchao Li, Chao Li, Shuai Xie, Wei Yu, Shijun Li

Regular Paper

One-step graph-based incomplete multi-view clustering

Baishun Zhou, Jintian Ji, Zhibin Gu, Zihao Zhou, Gangyi Ding, Songhe Feng

Regular Paper

Detecting facial manipulated images via one-class domain generalization

Pengxiang Xu, Zhiyuan Ma, Xue Mei, jie Shen

Regular Paper

Locally controllable network based on visual–linguistic relation alignment for text-to-image generation

Zaike Li, Li Liu, Huaxiang Zhang, Dongmei Liu, Yu Song, Boqun Li

Regular Paper

Video–text retrieval via multi-modal masked transformer and adaptive attribute-aware graph convolutional network

Gang Lv, Yining Sun, Fudong Nian

Special Issue Paper

HCNNet: hybrid convolution neural network for automatic identification of ischaemia in diabetic foot ulcer wounds

Sujit Kumar Das, Suyel Namasudra, Arun Kumar Sangaiah

Regular Paper

MCLEMCD: multimodal collaborative learning encoder for enhanced music classification from dances

Wenjuan Gong, Qingshuang Yu, Haoran Sun, Wendong Huang, Peng Cheng, Jordi Gonzàlez

Survey

Seismic data compression: an overview

Dorsaf Sebai, Manel Zouaoui, Faouzi Ghorbel

Regular Paper

Lightweight image super-resolution based on stepwise feedback mechanism and multi-feature maps fusion

Xu Yao, Houjin Chen, Yanfeng Li, Jia Sun, Jiayu Wei

Open Access Regular Paper

A comparative study of color quantization methods using various image quality assessment indices

María-Luisa Pérez-Delgado, M. Emre Celebi

Regular Paper

Weighted bilinear factorization of low-rank matrix with structural smoothness for image denoising

Wanhong Wu, Zikai Wu, Hongjuan Zhang

Regular Paper

Generalizing sentence-level lipreading to unseen speakers: a two-stream end-to-end approach

Yu Li, Feng Xue, Lin Wu, Yincen Xie, Shujie Li

Regular Paper

STSD: spatial–temporal semantic decomposition transformer for skeleton-based action recognition

Hu Cui, Tessai Hayama

Open Access Regular Paper

Real-walk modelling: deep learning model for user mobility in virtual reality

Murtada Dohan, Mu Mu, Suraj Ajit, Gary Hill

Regular Paper

Adequately hierarchical patterns based on pairwise regions

Thanh Tuan Nguyen, Thanh Phuong Nguyen, Frédéric Bouchara

Regular Paper

An ensemble pruning method considering classifiers’ interaction based on information theory for facial expression recognition

Yiqing Wu, Danyang Li, Xing Chen, Yumei Tang, Shisong Huang

Regular Paper

Bag of states: a non-sequential approach to video-based engagement measurement

Ali Abedi, Chinchu Thomas, Dinesh Babu Jayagopi, Shehroz S. Khan

Regular Paper

BENet: bi-directional enhanced network for image captioning

Peixin Yan, Zuoyong Li, Rong Hu, Xinrong Cao

Regular Paper

An entropy-weighted local intensity clustering-based model for segmenting intensity inhomogeneous images

Wei-Ting Liao, Suh-Yuh Yang, Cheng-Shu You

Special Issue Paper

GVA: guided visual attention approach for automatic image caption generation

Md. Bipul Hossen, Zhongfu Ye, Amr Abdussalam, Md. Imran Hossain

Regular Paper

Depth alignment interaction network for camouflaged object detection

Hongbo Bi, Yuyu Tong, Jiayuan Zhang, Cong Zhang, Jinghui Tong, Wei Jin

Regular Paper

A multi-layer mesh synchronized reversible data hiding algorithm on the 3D model

Guoyou Zhang, Zheyu Sui, Chaoli Sun, Qi Liu, Xiaoxue Cheng

Regular Paper

You watch once more: a more effective CNN architecture for video spatio-temporal action localization

Yefeng Qin, Lei Chen, Xianye Ben, Mingqiang Yang

Regular Paper

Object-based video anomaly detection using multi-attention and adaptive velocity attribute representation learning

Xiaopeng Ren, Huifen Xia, Yongzhao Zhan

Regular Paper

Ecarnet: enhanced clue-ambiguity reasoning network for multimodal fake news detection

Shannan Zhong, ShuJuan Peng, Xin Liu, Lei Zhu, Xing Xu, Taihao Li

Regular Paper

A defensive attention mechanism to detect deepfake content across multiple modalities

S. Asha, P. Vinod, Varun G. Menon

Regular Paper

An insight into topological, machine and Deep Learning-based approaches for influential node identification in social media networks: a systematic review

Yasir Rashid, Javaid Iqbal Bhat

Open Access Regular Paper

MVIndEmo: a dataset for micro video public-induced emotion prediction on social media

Zhenhua Guo, Qi Jia, Baoyu Fan, Di Wang, Cong Xu, Yanwei Wang, Yaqian Zhao, Rengang Li

Regular Paper

Weighted sparse gradient reconstruction model with a robust fidelity for edge-aware image smoothing

Lanling Zeng, Yucheng Chen, Yang Yang

Regular Paper

Attribute- and attention-guided few-shot classification

Ziquan Wang, Hui Li, Zikai Zhang, Feng Chen, Jia Zhai

Springer Professional

Multimedia Systems

Content (60 Articles)

Current Publications