1. Contextualização
    1. Motivação
      1. A previsão de tendências de séries temporais financeiras é uma das áreas de pesquisa mais ativas para economia e investimentos
      2. A previsão da tendência de preços é uma questão valiosa que influencia fortemente a correção da tomada de decisão.
    2. Objetivos
      1. Prever a tendência dos preços do mercado de ações com base em HMM de alta ordem
    3. Desafios
      1. A previsão de séries temporais financeiras é difícil devido a incertezas e fatores não lineares envolvidos nos dados.
        1. Na verdade, um mercado de ações é um sistema altamente complexo, que consiste em muitos componentes cujo preço sobe e desce sem ter padrões significativos
    4. Técnicas usadas para previsão de tendências temporais
      1. Redes Neurais
      2. SVM - Support Vector Machines
      3. Ensemble Learning
      4. HMM
    5. HMM
      1. Popular para modelar dados sequenciais, como séries temporais, normalmente com base na suposição de uma cadeia de Markov de primeira ordem
        1. A propriedade de Markov desempenha um papel importante na previsão de séries temporais financeiras
        2. Pesquisas sobre HMM na previsão de tendências de mercado supõem que as memórias de curto prazo existem na dinâmica financeira temporal
        3. A distribuição de probabilidade condicional de estados futuros do processo (condicional tanto em estados passados, como presentes) depende apenas do estado presente, não da sequência de eventos que o precedeu
      2. Limitações
        1. o HMM de primeira ordem é estritamente limitado aos casos em que a observação em cada intervalo de tempo é condicionalmente independente do histórico de observações e do histórico de estados, dado o estado atual
          1. No campo das finanças, observa-se que as séries temporais financeiras apresentam memórias de tempo de várias escalas
          2. Se usarmos apenas o HMM de primeira ordem ele ignorará a possibilidade de uma dinâmica temporal mais longa nas séries temporais
    6. HMM de alta ordem. Por que?
      1. Vantagens
        1. HMM de alta ordem considera a dependência do tempo de curto e longo prazo
          1. Pode fornecer uma maneira possível de incorporar a memória longa na dinâmica dos estados
        2. As questões de dependência do tempo e volatilidade neste problema fizeram do Hidden Markov Model (HMM) a melhor técnica para previsão das tendências
        3. O HMM de alta ordem tem maior precisão e menor risco do que o modelo de primeira ordem na previsão da tendência do preço dos índices
      2. Principal diferença com relação ao HMM de primeira ordem
        1. HMM de alta ordem considera que o próximo estado na cadeia de Markov depende de vários estados anteriores, em vez de considerar apenas um estado anterior
  2. Abordagem
    1. Será feita a previsão de negociação dos índices CSI300 e S&P500
    2. Dados de abril/2005 a julho/2017
    3. Dataset
      1. Cada registro contém o fechamento, abertura, alta, baixa e volume de negociação
  3. HMM de primeira ordem
    1. Definição
      1. HMM é um processo estocástico que conecta uma cadeia de Markov
        1. Número finito de estados
        2. Há um conjunto de funções aleatórias (observações) para cada estado oculto
      2. Um HMM é equivalente a um AFN probabilístico
        1. HMM
          1. AFN probabilístico
    2. Aplicação
      1. Nesse projeto, modela o índice de ações como uma série temporal
    3. Estimação dos parâmetros (probabilidades de emissão e transição)
      1. Utiliza-se o algoritmo Baum-Welch
        1. É feita uma normalização logaritmica nos dados de entrada
          1. Após a execução de testes com a amostra, foi selecionada a mistura gaussiana 3 por obter os menores Akaike information criterion (AIC) e Bayesian information criterion (BIC)
    4. Determinação dos estados ocultos
      1. Com o HMM treinado, o algoritmo Viterbi é usado para determinar uma sequência de estados ocultos que pode melhor explicar as observações
        1. Explicação dos Estados Ocultos neste experimento: para cada dia t, há o estado oculto it. O estado g t+1 corresponde ao retorno do dia seguinte. log_return positivo/negativo significam alta/baixa no dia seguinte (t+1)
          1. Retorno cumulativo para cada estado oculto
          2. Há uma relação entre o desempenho dos preços do índice de mercado e os estados ocultos, que podem ser usados ​​para interpretar o possível estado do mercado e prever a tendência dos preços
  4. HMM de alta ordem
    1. Definição
      1. A probabilidade de transição do estado i é condicionada a n estados anteriores
      2. A observação "o" também não depende apenas do estado atual, mas dos m-1 estados ocultos anteriores
      3. Constrói-se um HMM de alta ordem (n, m)
        1. Quando n = m = 1, é um HMM de primeira ordem
      4. A sequência de estados ocultos é um processo de Markov de ordem n sobre um conjunto finito de estados S
    2. Parâmetros
      1. Para treinar o HMM de alta ordem a partir de determinada sequência de observação
        1. Probabilidade das Transições de Estado
        2. Probabilidade das Observações
        3. Probabilidade dos estados iniciais
        4. Parâmetros do HMM de alta ordem
    3. Resolução
      1. Para melhorar o processo de treinamento e estimação de parâmetros, o autor apresenta a necessidade de uma abordagem chamada transformação de estado
        1. Transforma qualquer número base N para o seu valor decimal. Após a transformação, a complexidade dos cálculos assemelha-se aos HMM de primeira ordem
  5. Estratégia de negociação baseada em HMM de alta ordem
    1. Metodologia
      1. 1. Usar HMM para obter o estado oculto bem ajustado do dia t atual.
      2. 2. Encontrar os dias t's no passado que possuem o mesmo estado oculto que o dia t
      3. 3. Para cada t's, coletamos os retornos de preço no dia seguinte a t's no histórico
      4. 4. Prever a tendência para o índice de preço de amanhã de t
    2. Executando
      1. Entradas
        1. Escolhe-se a sequência g't do índice de preços
        2. Usa-se essa sequência como entrada de sequência de observações o't (sendo T=hoje, o't a observação de hoje)
      2. Parâmetros
        1. Estima-se os parâmetros lâmbida do HMM de alta ordem a partir de o't
      3. Determinando os estados ocultos
        1. Usando o algoritmo Viterbi, determina-se uma sequência de estados ocultos que melhor explica a observação o't
        2. O estado oculto preciso pode ser representado pelo estado oculto transformado
      4. Predição
        1. Sumariza-se todos os dias da sequência que têm o mesmo estado oculto do dia atual
        2. Define-se o retorno total como a soma de todos os retornos dos dias seguintes aos dias que possuem o mesmo estado oculto
        3. 3 estados são considerados nos preços: alta, baixa ou constância
        4. Um algoritmo dinâmico é aplicado ao invés de um estático
          1. Para cada janela de tempo, usa-se o estado oculto atual para gerar um sinal de negociação para o próximo dia de negociação: alta, baixa, constância
      5. Dificuldades
        1. Quando a diferença na probabilidade de diferentes estados ocultos é relativamente pequena, torna-se difícil determinar o estado oculto
        2. Quando estado oculto obtido aparece raramente na história
        3. Define-se estado = constância
    3. Avaliação de Desempenho
      1. Eficiência
        1. Sensibilidade (Recall)
          1. Taxa de verdadeiro positivos sobre os que foram classificados como positivo
        2. Precisão
          1. Taxa de verdadeiro positivo sobre verdadeiro positivo e falso positivo
      2. Financeiro
        1. A taxa de vitória (WR)
          1. Relação entre o lucro comercial e o número total de negociações
        2. Retorno anual
          1. É o retorno que um investimento fornece ao longo de um período de tempo
        3. Drawdown máximo (MDD)
          1. É a perda máxima desde um pico até um vale de uma carteira, antes que um novo pico seja atingido
          2. É o pior cenário possível para uma estratégia de negociação -> quanto menor, melhor
        4. Índice Sharpe
          1. Mede o retorno excedente de uma aplicação financeira em relação a outra aplicação livre de risco
  6. Resultados
    1. Sobre o índice CSI300
    2. Sobre o índice S&P500
  7. Conclusão
    1. Os resultados experimentais mostram que essa abordagem tem um bom desempenho na previsão de tendência do índice CSI 300 e S&P 500.
    2. Comparado ao HMM de primeira ordem comumente usado, este HMM de alta ordem tem maior precisão de predição