在新选项卡中打开链接
  1. [论文精读 | CVPR2020] Listen to Look: Action …

    • 提出两个框架
      IMGAUD2VID
      •通过单针图片与其对应的图片提取hallucinates clip-lev… 展开

    1. Introduction(Why do this work?)

    应用层面
    •数据增长量大,需要从精度和效率两个层面来对untrimmed video做识别;
    •主要应用点:video recommendation, summarization, … 展开

    知乎专栏
    2. Related Work

    主要从以下六个方面描述,这里就先不写了,后面有时间再写。
    •Action Recognition
    •Action Proposal and Localization
    •Audio-Visual An… 展开

    知乎专栏
    3. Approach

    3.1. Problem Formulation
    •V —— a long untrimmed video ,未经过处理的一段原始视频 •C —— classes,视频行为的类别 •A —— Each video clip V is accompanied by … 展开

    知乎专栏