Project README

GroupViT: Semantic Segmentation Emerges from Text Supervision

GroupViT is a framework for learning semantic segmentation purely from text captions without using any mask supervision. It learns to perform bottom-up heirarchical spatial grouping of semantically-related visual regions. This repository is the official implementation of GroupViT introduced in the paper:

GroupViT: Semantic Segmentation Emerges from Text Supervision, Jiarui Xu, Shalini De Mello, Sifei Liu, Wonmin Byeon, Thomas Breuel, Jan Kautz, Xiaolong Wang, CVPR 2022.

Visual Results

Links

Jiarui Xu's Project Page (with additonal visual results)
arXiv Page

Open Source Agenda is not affiliated with "GroupViT" Project. README Source: NVlabs/GroupViT

Stars

693

Open Issues

Last Commit

1 year ago

Repository

NVlabs/GroupViT

Homepage

https://arxiv.org/abs/2202.11094

Open Source Agenda Badge

<a href="https://www.opensourceagenda.com/projects/groupvit"><img src="https://www.opensourceagenda.com/projects/groupvit/reviews/badge.svg" alt="Open Source Agenda"></a>

Submit Review Review Your Favorite Project

Submit Resource Articles, Courses, Videos

Submit Article Submit a post to our blog

From the blog

Dec 11, 2022

GroupViT Save

GroupViT: Semantic Segmentation Emerges from Text Supervision

Visual Results

Links

Open Source Agenda Badge

From the blog

How to Choose Which Programming Language to Learn First?

From the blog

How to Choose Which Programming Language to Learn First?