1. Inferência de eventos em vídeos
    1. Gráfico And-Or para descrever as categorias de eventos de chutes (futebol)
    2. Relações Temporais
    3. Relações de Papéis (funções)
    4. Desenvolvimento de algoritmo
      1. Bottom-up
        1. Considerando 3 termos de energia
      2. Top-Down
        1. Refinamento
          1. Similaridade dos rótulos de ação
          2. Penalização dos deslocamentos temporais
      3. Resultado
        1. Proposta ótima do evento inferido
        2. Score
    5. Experimentos
      1. Testes da performance da inferência em eventos reais
    6. Abordagem
      1. É possível inferir diferentes tipos de eventos em um cenário e interpretá-los de maneira flexível
    7. Transformadas vetores de parâmetros para cada nó do grafo
  2. Introdução
    1. Analisar e compreender vídeos de atividades humanas é um desafio e um tópico de pesquisa em alta.
    2. Tarefas -chave
      1. Rastreamento de objetos, reconhecimento da ação humana e classificação da atividade humana, são bem estudadas na pesquisa de visão computacional
    3. 1. Obtenção dos Dados
      1. Ações executadas por múltiplos jogadores
    4. 2. Categorização dos dados
      1. Grafos And-Or
        1. Folhas
          1. Representam as ações realizadas por diferentes funções de jogadores
        2. Nós And-Or
          1. Representam as composições hierárquicas do evento
        3. Considera-se as relações temporais e de função
    5. 3. Algoritmo de inferência
      1. Bottom-Up
        1. Para propor configurações para os eventos de filmagem
          1. Termos de Energia: Dados, Estrutura e Relação
      2. Top-Down
        1. Refinamento das propostas
      3. Refinamento por similaridade de rótulo e penalização de deslocamento temporal
    6. 4. Resultados: Diferentes tipos de inferência (exemplo cabeceada. pênalti)
      1. Foram usados comentários jogada a jogada para entender o que acontece no exato momento (opinião de especialista)
    7. 5. Principais contribuições do paper
      1. Representamos os eventos de vídeo complexos compostos de ações multiagentes e testamos o algoritmo de inferência em vídeos reais de partidas de futebol. As várias configurações dos eventos são representadas por um grafo And-Or. Os processos ascendente e descendente são usados para inferir os eventos a partir das ações realizadas por vários jogadores.
      2. Nós consideramos relações temporais e relações de função no grafo And-Or. Como dezenas de segmentos temporais do mesmo rótulo de ação aparecem nos vídeos, um tipo de rótulo de ação mal consegue identificar o acontecimento do evento inferente. Codificamos todas as seis condições de relações temporais e quatro de relações de função para cada par de nós, o que torna possível representar a relação entre as ações com o mesmo rótulo semântico.
  3. Trabalhos relacionados
    1. Tipos de trabalhos
      1. Trabalhos relacionados sobre compreensão de atividades de grupo
      2. Análise de eventos esportivos
        1. The storyline of a video describes the causal relationships between actions
      3. Grafos And-Or para representação de imagens
  4. Representação dos eventos do vídeo
    1. Definições
      1. The structure of an And-Or graph is represented by a five-tuple
        1. S é o nó raiz para uma categoria de evento
        2. V(N) é o conjunto de nós não terminais, que contém nós-And e nós-Or.
          1. Cada NÓ AND, representando um evento ou subevento, é decomposto em subeventos ou ações atômicas como seus nós filhos. Todos os nós filhos do evento ou subevento devem ocorrer quando isso acontecer.
          2. Cada NÓ OR é uma chave para todas as condições de um evento ou subevento, com uma distribuição para indicar a frequência de cada condição.
        3. V(T) é o conjunto de nós terminais, representando ações humanas atômicas
        4. R é o conjunto de relações entre os filhos de nós-And, Consideramos relações temporais e de função
        5. P é o modelo de probabilidade definido no gráfico.
    2. Exemplo
      1. A estrutura do gráfico é definida manualmente com base no estudo de caso
      2. Os parâmetros e relações para todos os nós são aprendidos a partir dos dados de treinamento
    3. Nós Não-Terminais
      1. Os nós não terminais VN são compostos de um conjunto de nós And e um conjunto de nós Or. Cada nó And representa um determinado tipo de subevento de tiro. Cada nó Ou tem uma distribuição a priori para indicar a frequência de escolha de um de seus filhos.
      2. O nó raiz SV e representa todos os tipos de eventos de tiro durante a partida de futebol. Possui três filhos, ilustrados como O1; O2; O3, representando o início, o andamento e o término dos eventos de tiro, respectivamente
    4. Nós Terminais
      1. Os nós terminais representam as ações humanas atômicas realizadas pelos jogadores durante a partida de futebol. Cada ação é realizada por um determinado jogador em um intervalo de tempo contínuo. Por um determinado intervalo de tempo, várias ações acontecem simultaneamente, enquanto uma lista de ações acontecem sequencialmente para um determinado jogador.
      2. Conforme mostrado na Figura 1, considerando o papel do jogador e o rótulo semântico da ação, definimos 12 categorias de ações para os eventos de disparo, listados na Tabela I. Para cada vt VT, aprendemos seu rótulo semântico do conjunto de dados de treinamento.
      3. Atributos
        1. The human actions fai g in videos can be represented as a state attribute. label(ai) and lambda(ai) denote the set of semantic category labels of the action and the corresponding similarity with the action category for classification. There are six categories of important human actions according to our graph definition, labeled as run, kick, head, pick, stand, and rush. cai represents the roles of the action players, marked as team A, team B, and the keeper.
        2. Duração
          1. We defined a temporal duration for all nodes in the And-Or graph, where t(v) denotes the start anchor point of v, and I(v) denotes the length of the temporal interval.
          2. The prior temporal duration for each node v is learned as well
    5. Relações
      1. Relações Temporais
        1. Existem seis relações temporais binárias de acordo com a teoria da lógica temporal de Allen
          1. Antes
          2. A termina antes que B aconteça
          3. Sobreposição
          4. B começa antes que A termine
          5. Encontro
          6. A termina ao mesmo tempo que B
          7. Durante
          8. B começa depois que A já começou, e termina antes de A terminar
          9. Início
          10. A e B começam ao mesmo tempo
          11. Fim
          12. A e B terminam ao mesmo tempo
      2. Relações de Papéis
        1. Representa as restrições dos jogadores a um par de ações
          1. Relações Unárias
          2. A mesma pessoa
          3. Jogador
          4. Goleiro
          5. Relações Binárias
          6. Jogadores do mesmo time
          7. Adversários
          8. Jogador e Goleiro