Zheng Zhang

Research

My long-term research interest is to find a path to build a universal learning system, and my short-term research interest is to explore a better path to build universal visual perception system. Now, I am closely collaborating with Han Hu, Houwen Peng and Steve Lin at Microsoft Research Asia. Previously, I closely collaborated with Yue Cao and Xizhou Zhu. Meanwhile, I was mentored by Prof. Xiang Bai as a student at Huazhong University of Science and Technology, and by Jifeng Dai as a young researcher at Microsoft Research Asia.

Please drop me an email if you are interested in doing research with me.

E-mail: macaroniz1990 [at] outlook [dot] com, zhez [at] microsoft [dot] com

Professional Services

Senior Program Committee member: AAAI2022
Conference reviewer: CVPR, ICCV, ECCV, NeurIPS, ICML, AAAI, WACV, ACCV, IJCAI
Journal reviewer: TPAMI, IJCV, CVIU

Publications

(†Interns or Students, *Equal Contribution)

Side Adapter Network for Open-Vocabulary Semantic Segmentation
Mengde Xu*†, Zheng Zhang*, Fangyun Wei, Han Hu, Xiang Bai, Computer Vision and Pattern Recognition(CVPR), 2023, Hightlight, [PDF][Project][Code]

All in Tokens: Unifying Output Space of Visual Tasks via Soft Token
Jia Ning*†, Chen Li*†, Zheng Zhang*, Chunyu Wang, Zigang Geng, Qi Dai, Kun He, Han Hu, International Conference on Computer Vision(ICCV), 2023, Oral, [PDF][Code]

Exploring Discrete Diffusion Models for Image Captioning
Zixin Zhu*†, Yixuan Wei*†, Jianfeng Wang, Zhe Gan, Zheng Zhang, Le Wang, Gang Hua, Lijuan Wang, Zicheng Liu, Han Hu, Arxiv, 2023, [PDF][Code]

On Data Scaling in Masked Image Modeling
Zhenda Xie*†, Zheng Zhang*, Yue Cao*, Yutong Lin, Yixuan Wei, Qi Dai, Han Hu, Computer Vision and Pattern Recognition(CVPR), 2023, [PDF]

Revealing The Dark Secrets of Masked Image Modeling
Zhenda Xie*†, Zigang Geng*†, Jingcheng Hu, Zheng Zhang, Han Hu, Yue Cao, Computer Vision and Pattern Recognition(CVPR), 2023, [PDF]

Contrastive Learning Rivals Masked Image Modeling in Fine-tuning via Feature Distillation
Yixuan Wei*†, Han Hu*, Zhenda Xie, Zheng Zhang, Yue Cao, Jianmin Bao, Dong Chen, Baining Guo, International Conference on Computer Vision(ICCV), 2023, [PDF][Code]

SimMIM: A Simple Framework for Masked Image Modeling
Zhenda Xie*†, Zheng Zhang*, Yue Cao*, Yutong Lin, Jianmin Bao, Zhuliang Yao, Qi Dai, Han Hu*, Computer Vision and Pattern Recognition(CVPR), 2022, [PDF][Code]

Swin Transformer V2: Scaling Up Capacity and Resolution
Ze Liu*†, Han Hu*, Yutong Lin, Zhuliang Yao, Zhenda Xie, Yixuan Wei, Jia Ning, Yue Cao, Zheng Zhang, Li Dong, Furu Wei, Baining Guo, Computer Vision and Pattern Recognition(CVPR), 2022, [PDF][Code]

Video Swin Transformer
Ze Liu*†, Jia Ning*†, Yue Cao, Yixuan Wei†, Zheng Zhang, Steve Lin, Han Hu, Computer Vision and Pattern Recognition(CVPR), 2022, [PDF][Code]

A Simple Baseline for Zero-shot Semantic Segmentation with Pre-trained Vision-language Model
Mengde Xu*†, Zheng Zhang*, Fangyun Wei*, Yutong Lin, Yue Cao, Han Hu, Xiang Bai, Europe Conference on Computer Vision(ECCV), 2022, [PDF][Code]

Bootstrap Your Object Detector via Mixed Training
Mengde Xu*, Zheng Zhang*, Fangyun Wei*, Yutong Lin*, Yue Cao, Stephen Lin, Han Hu, Xiang Bai, Neural Information Processing Systems(NeurIPS), 2021, Spotlight, [PDF][Code]

Breaking Shortcut: Exploring Fully Convolutional Cycle-Consistency for Video Correspondence Learning
Yansong Tang*†, Zhenyu Jiang*†, Zhenda Xie*†, Yue Cao, Zheng Zhang, Philip HS Torr, Han Hu, International Conference on Computer Vision（ICCV) Workshop, 2021, [PDF][Code]

Self-supervised Learning with Swin Transformers
Zhenda Xie*†, Yutong Lin*†, Zhuliang Yao†, Zheng Zhang, Qi Dai, Yue Cao, Han Hu, Arxiv, 2021, [PDF][Code]

End-to-End Semi-Supervised Object Detection with Soft Teacher
Mengde Xu*†, Zheng Zhang*†, Han Hu*, Jianfeng Wang, Lijuan Wang, Fangyun Wei, Xiang Bai, Zicheng Liu, International Conference on Computer Vision(ICCV), 2021, [PDF][Code]

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Ze Liu*†, Yutong Lin*†, Yue Cao*, Han Hu*, Yixuan Wei†, Zheng Zhang, Steve Lin, Baining Guo, International Conference on Computer Vision(ICCV), 2021, Best Paper, Marr Prize, [PDF][Code]

Group-Free 3D Object Detection via Transformers
Ze Liu†, Zheng Zhang, Yue Cao, Han Hu, Xin Tong, International Conference on Computer Vision(ICCV), 2021, [PDF][Code@Official][Code@MMDetection3D]

Propagate Yourself: Exploring Pixel-Level Consistency for Unsupervised Visual Representation Learning
Zhenda Xie*†, Yutong Lin*†, Zheng Zhang, Yue Cao, Stephen Lin, Han Hu, Computer Vision and Pattern Recognition(CVPR), 2020, [PDF][Code]

RepPoints V2: Verification Meets Regression for Object Detection
Yihong Chen†, Zheng Zhang, Yue Cao, Liwei Wang, Steve Lin, Han Hu, Neural Information Processing Systems(NeurIPS), 2020, [PDF][Code]

Parametric Instance Classification for Unsupervised Visual Feature Learning
Yue Cao*, Zhenda Xie*†, Bin Liu*†, Yutong Lin†, Zheng Zhang, Han Hu, Neural Information Processing Systems(NeurIPS), 2020, [PDF][Code]

Spatially Adaptive Inference with Stochastic Feature Sampling and Interpolation
Zhenda Xie*†, Zheng Zhang*, Xizhou Zhu*†, Gao Huang, Stephen Lin, Europe Conference on Computer Vision(ECCV), 2020, Oral, [PDF][Code]

A Closer Look at Local Aggregation Operators in Point Cloud Analysis
Ze Liu*†, Han Hu*, Yue Cao, Zheng Zhang, Xin Tong, Europe Conference on Computer Vision(ECCV), 2020, [PDF][Code]

Disentangled Non-Local Neural Networks
Minghao Yin*†, Zhuliang Yao*†, Yue Cao, Xiu Li, Zheng Zhang, Steve Lin, Han Hu, Europe Conference on Computer Vision(ECCV), 2020, [PDF][Code@Det][Code@Seg]

Dense RepPoints: Representing Visual Objects With Dense Point Sets
Ze Yang*†, Yinghao Xu*†, Han Xue*†, Zheng Zhang, Raquel Urtasun, Liwei Wang, Stephen Lin, Han Hu, Europe Conference on Computer Vision(ECCV), 2020, [PDF][Code]

Negative Margin Matters: Understanding Margin in Few-shot Classification
Bin Liu†, Yue Cao, Yutong Lin†, Qi Li†, Zheng Zhang, Mingsheng Long, Han Hu, Europe Conference on Computer Vision(ECCV), 2020, Spotlight, [PDF][Code]

Local Relation Networks For Image Recognition
Han Hu, Zheng Zhang, Zhenda Xie, Stephen Lin, International Conference on Computer Vision(ICCV), 2019, [PDF]

Spatial-Temporal Relation Networks For Multi-Object Tracking
Jiarui Xu†, Yue Cao†, Zheng Zhang, Han Hu, International Conference on Computer Vision(ICCV), 2019, [PDF]

An Empirical Study Of Spatial Attention Mechanisms In Deep Networks
Xizhou Zhu*†, Dazhi Cheng*†, Zheng Zhang*, Stephen Lin, Jifeng Dai, International Conference on Computer Vision(ICCV), 2019, [PDF][Code]

Integrated Object Detection And Tracking With Tracklet-Conditioned Detection
Zheng Zhang*, Dazhi Cheng*†, Xizhou Zhu*†, Stephen Lin, Jifeng Dai, Arxiv, 2018, [PDF]

Relation networks for object detection
Han Hu*, Jiayuan Gu*†, Zheng Zhang*, Jifeng Dai, Yichen Wei, Computer Vision and Pattern Recognition(CVPR), 2018, Oral, [PDF][Code]

Deformable Convolutional Networks–COCO Detection And Segmentation Challenge 2017 Entry
Haozhi Qi†, Zheng Zhang, Bin Xiao, Han Hu, Bowen Cheng, Yichen Wei, Jifeng Dai, ICCV COCO Challenge Workshop(ICCV Workshop), 2017

Symmetry-Based Object Proposal For Text Detection
Xuelei Zhang, Zheng Zhang, Chengquan Zhang, Xiang Bai, International Conference on Pattern Recognition(ICPR), 2016

Multi-Oriented Text Detection With Fully Convolutional Networks
Zheng Zhang*, Chengquan Zhang*, Wei Shen, Cong Yao, Wenyu Liu, Xiang Bai, Computer Vision and Pattern Recognition(CVPR), 2016, [PDF][Code]

Symmetry-Based Text Line Detection In Natural Scenes
Zheng Zhang, Wei Shen, Cong Yao, Xiang Bai, Computer Vision and Pattern Recognition(CVPR), 2015, [PDF][Code]

Awards

3rd in COCO Object Detection Competition and 4th in COCO Instance Segmentation Competition, 2017
National Scholarship, Huazhong University of Science and Technology, 2015
ACM ICPC Regional Gold Medal, Changsha, 2013
Excellent Internship Award, Microsoft Research Asia, 2013
Imagine Cup(China) Second Price, 2012