Intraday Alta Frequência Forex Trading With Adaptive Neuro Fuzzy Inferência Sistemas


Negociação FX de alta freqüência intradía com sistemas adaptativos de inferência neuro-fuzzy Abdalla Kablan e Wing Lon Ng Resumo: Este artigo introduz um sistema de inferência adaptativo neuroferido (ANFIS) para negociação financeira, que aprende a prever movimentos de preços a partir de dados de treinamento consistindo em intradía Marcar dados amostrados em alta freqüência. Os dados empíricos utilizados na nossa investigação são séries temporais de preços médios de cinco minutos a partir dos mercados FX. A otimização ANFIS envolve back-testing, bem como a variação do número de épocas, e é combinado com um novo método de captura de volatilidade usando uma abordagem baseada em eventos que leva em consideração as mudanças direcionais dentro de limiares pré-especificados. Os resultados mostram que o modelo proposto supera as estratégias padrão, como o buy-and-hold ou a previsão linear. Downloads: (link externo) indersciencelink. phpid38529 (texthtml) O acesso ao texto completo é restrito aos assinantes. Trabalhos relacionados: este item pode estar disponível em outros lugares no EconPapers: procure itens com o mesmo título. Referência de exportação: BibTeX RIS (EndNote, ProCite, RefMan) HTMLText Mais artigos na Revista Internacional de Mercados Financeiros e Derivados dos dados da série Inderscience Enterprises Ltd mantidos por Darren Simpson (). Este site faz parte do RePEc e todos os dados exibidos aqui fazem parte do conjunto de dados RePEc. O seu trabalho está faltando no RePEc. Aqui está como contribuir. Perguntas ou problemas Verifique as perguntas frequentes do EconPapers ou envie mensagens para o comércio FX de alta frequência intra-internacional com sistemas de inferência adaptativa neuro-difusas. Abdalla Kablan e Wing Lon Ng Transcrição 1 68 Int. J. Financial Markets and Derivatives, Vol. 2, Nos. 12, 2011 Negociação FX de alta freqüência intradía com sistemas adaptativos de inferência neuro-difusa Abdalla Kablan e Wing Lon Ng Centro de Finanças Computacionais e Agentes Econômicos (CCFEA), Universidade de Essex, Wivenhoe Park, Colchester, CO4 3SQ, Reino Unido Autor de correspondência Resumo: Este artigo introduz um sistema de inferência neuro-difusa adaptativo (ANFIS) para o comércio financeiro, que aprende a prever movimentos de preços a partir de dados de treinamento consistindo em dados de tiques intradiários amostrados em alta freqüência. Os dados empíricos utilizados na nossa investigação são séries temporais de preços médios de cinco minutos a partir dos mercados FX. A otimização ANFIS envolve back-testing, bem como a variação do número de épocas, e é combinado com um novo método de captura de volatilidade usando uma abordagem baseada em eventos que leva em consideração as mudanças direcionais dentro de limiares pré-especificados. Os resultados mostram que o modelo proposto supera as estratégias padrão, como o buy-and-hold ou a previsão linear. Palavras-chave: sistema de inferência neuro-fuzzy adaptativo de negociação de finanças de alta freqüência Sazonalidade intradiária dos mercados de câmbio da ANFIS. A referência a este artigo deve ser feita da seguinte forma: Kablan, A. e Ng, W. L. (2011) Negociação FX de alta frequência intradua com sistemas de inferência adaptativa neuro-fuzzy, Int. J. Financial Markets and Derivatives, Vol. 2, Nos. 12, pp. Notas biográficas: os interesses de pesquisa de Abdalla Kablan incluem inteligência artificial e suas aplicações em engenharia financeira. Sua pesquisa também inclui as aplicações de heurísticas e sistemas neuro-difusos para a tomada de decisões financeiras. Wing Lon Ng é um conferencista em Finanças de alta frequência. Os seus interesses de pesquisa incluem econometria financeira e finanças computacionais e suas aplicações na análise empírica de microestrutura de mercado. 1 Introdução Os investidores e comerciantes financeiros sempre tentaram prever o movimento dos mercados de ações (por exemplo, Schulmeister, 2009). A própria negociação financeira está incorporada em uma estrutura complexa, não só envolvendo a dinâmica da formação de preços, mas também a própria microestrutura do mercado. Informações de mercado, notícias e fatores externos afetam as decisões de negociação de investidores em relação à compra e venda. Normalmente, o padrão de preços é difícil de reconhecer, notar ou categorizar, independentemente do tipo de mercado financeiro atual Copyright 2011 Inderscience Enterprises Ltd. 2 Intraday de alta freqüência FX trading com ANFISs 69 estudou (Murphy, 1986). Este artigo apresenta um modelo que tenta provar que a inteligência artificial e soft computing, como o sistema de inferência adaptativo neuroferido (ANFIS), podem fornecer uma solução importante nessas tarefas. A abordagem da lógica difusa, inspirada por um modelo de raciocínio humano em que os termos linguísticos são usados ​​e as quantidades difusas (ao contrário de crisp) são manipuladas, é combinada em sistemas neurocircuncisos com a capacidade de reconhecimento de padrões das redes neurais (ver Konstantaras et al 2006 Sewell, 2010). A recente escalada no poder de computação levou a um grande aumento na disponibilidade de dados e informações. Computadores, sensores e canais de informação estão se desenvolvendo mais rapidamente, e os dados são mais fáceis de colecionar do que nunca. Devido à disponibilidade de informações em tempo real do livro de pedidos hoje em dia, a diferença na tomada de decisões e na tomada de riscos entre vários comerciantes representa um processo complicado que afeta as condições do mercado. A negociação de alta freqüência é uma nova disciplina na negociação financeira, onde as tendências são analisadas na moda tick-by-tick e as decisões de compra e venda são, portanto, tomadas. Portanto, a implementação de um sistema que proporcionaria um meio de capturar e prever os movimentos do mercado no nível em tempo real ajudaria a melhorar o histórico de negociação financeira de um investidor (ver Dacarogna et al. 2001 Dempster e Jones, 2001). Este artigo propõe uma nova técnica de processamento e filtração computacional que ainda não foi totalmente discutida ou implementada na literatura existente para uma pesquisa recente sobre estratégias de negociação algorítmica e sistemas de negociação, ver Aldridge (2009), Schulmeister (2009), Yeh et al. (2011), e as referências nele contidas. Tradicionalmente, a maioria dos algoritmos de previsão apresentados na literatura se concentram na mineração de dados, que é a integração de estatísticas, paradigmas de aprendizagem mecânica e análise de sistemas dinâmicos (por exemplo, Hellstrom e Holmstroumlm, 1998 Kasabov e Song, 2002). Além disso, dado que as séries temporais financeiras são muitas vezes muito barulhentas, um processo de filtragem deve remover esse ruído do sinal (Sheen, 2005). Uma arquitetura ANFIS foi escolhida para este sistema comercial automatizado, pois mostra um desempenho muito alto na modelagem de funções não-lineares e na identificação de componentes não-lineares (Denaiuml et al., 2007). O ANFIS financeiro proposto usa um algoritmo de aprendizagem híbrido e é capaz de construir um mapeamento de entrada e saída único com base em conhecimento humano (regras difusas) e pares de dados de entrada-saída estipulados (Castillo et al., 2006). Também mostrou excelentes resultados na previsão de séries temporais (ver Jang, 1993 Kasabov e Song, 2002). Além disso, uma vez que o sistema de negociação trata de dados intradiários, a entrada de dados para o sistema deve ser dessazonalizada de forma específica para separar o componente determinista na série de tempos, pois, de outra forma, iria introduzir autocorrelação espúria. A dessazonalização é realizada usando uma nova medida de volatilidade baseada em eventos (Glattfelder et al., 2010). O lembrete do artigo está organizado da seguinte forma. A Seção 2 apresenta a metodologia. A seção 3 apresenta os dados empíricos e os resultados. A seção 4 conclui. 2 Metodologia A seguir, a Seção 2.1 descreve o projeto e a arquitetura do ANFIS originalmente introduzido por Jang (1993). A Seção 2.2 então expande o uso do ANFIS para negociação financeira. A Seção 2.3 apresenta uma medida de volatilidade baseada em eventos para ser alimentada no ANFIS para capturar a sazonalidade intradia e otimizar o cronograma de negociação. 3 70 A. Kablan e W. L. Ng 2.1 A estrutura ANFIS O ANFIS é uma rede adaptativa de nós e links direcionais com regras de aprendizagem associadas. A abordagem aprende as regras e as funções de associação dos dados (Takagi e Sugeno, 1985). É chamado de adaptativo porque alguns ou todos os nós possuem parâmetros que afetam a saída do nó. Essas redes identificam e aprendem as relações entre insumos e saídas e possuem alto nível de capacidade de aprendizagem e propriedades de definição de função de associação. Embora as redes adaptativas cobrem várias abordagens diferentes, para nossos propósitos, realizaremos uma investigação detalhada do método proposto por Jang et al. (1997) com a arquitetura mostrada na Figura 1. Figura 1 Arquitetura ANFIS para um sistema Sugeno de duas regras (veja a versão online para cores) Layer 1 Layer 2 Layer 3 Layer 4 Layer 5 XA 1 w 1 w 1 w 1 f 1 A 2 FYB 1 w 2 w 2 w 2 f 2 B 2 Os nós circulares têm uma relação entrada-saída fixa, enquanto que os nós quadrados têm parâmetros a serem aprendidos. As regras fuzzy típicas são definidas como uma declaração condicional na forma: Se X é A1, então Y é B 1. (1) Se X é A2, então Y é B 2. (2) X e Y são variáveis ​​linguísticas A i e B são valores linguísticos determinados por conjuntos difusos nos universos particulares do discurso X e Y, respectivamente. No entanto, no ANFIS utilizamos o sistema Takagi-Sugeno de primeira ordem (Takagi e Sugeno, 1985), que é: Se X é A e Y é B, então f p X qy r. (3) Se X é A e Y é B, então f p X q Y r. (4) X e Y representam os universos do discurso A i e B i são termos linguísticos definidos por suas funções de associação, e p i, q i e r i são os parâmetros conseqüentes que são atualizados na passagem para a frente no algoritmo de aprendizagem. A passagem para a frente propaga o vetor de entrada através da rede camada por camada. Na passagem para trás, o erro é retornado através da rede de maneira similar à propagação posterior. Nós discutimos brevemente as cinco camadas no seguinte: 4 Negociação FX de alta freqüência intradía com ANFISs 71 1 A saída de cada nó na camada 1 é: O mu (x) para i 1,2 1, i O (x) para i 3,4. 1, i Ai mub i 2 (5) Portanto, O 1, i (x) é essencialmente o grau de associação para x e y. Embora as funções de associação possam ser muito flexíveis, os resultados experimentais levam à conclusão de que, para a tarefa de treinamento de dados financeiros, a função de adesão em forma de sino é mais apropriada (ver, por exemplo, Abonyi et al., 2001). Calculamos 1 mu (x), A 2b i x ci 1 a i (6) onde i, b i e c i são parâmetros a serem aprendidos. Estes são os parâmetros da premissa. 2 Na camada 2, cada nó é corrigido. É aí que a norma t é usada para AND e as notas de associação, por exemplo, o produto: O2, i wi mu A (x) mub (y), i 1,2. (7) ii 3 A camada 3 contém nós fixos que calculam a proporção das forças de disparo das regras: O 3, i wi wi ww Os nós na camada 4 são adaptativos e realizam o conseqüente das regras: () O wfwpxqyr (9 ) 4, iiiiii i. Os parâmetros (p i, q i, r i) nesta camada devem ser determinados e são referidos como os parâmetros conseqüentes. 5 Na camada 5, um único nó calcula a saída global: O wf (10) i i i 5, i wi fi. I i wi Isto é como o vetor de entrada normalmente é alimentado através da camada de rede por camada. Consideramos então como o ANFIS aprende a premissa e parâmetros conseqüentes para as funções de associação e as regras. Aplicamos o algoritmo de aprendizagem híbrido proposto por Jang et al. (1997) que usa uma combinação de descida mais íngreme e estimativa de mínimos quadrados (LSE) para calibrar os parâmetros na rede adaptativa (ver também Fontenla-Romero et al., 2003). Nós dividimos o conjunto de parâmetros total S em dois conjuntos adicionais S 1, o conjunto de parâmetros de premissa (não-lineares) e S 2, o conjunto de parâmetros conseqüentes (lineares). Neste estudo, o ANFIS usa um algoritmo de aprendizado de duas passagens. Na passagem para a frente, S1 não está modificado e S2 é calculado usando um algoritmo LSE, enquanto que na passagem para trás, S 1 não está modificado e S 2 é atualizado usando um algoritmo de descida de gradiente, como back-propagation (veja também a ilustração na Figura 2). (8) 5 72 A. Kablan e W. L. Ng Figura 2 Algoritmo de aprendizado para a frente e para trás (veja a versão on-line para cores) A ​​tarefa do algoritmo de aprendizagem ANFIS para esta arquitetura é sintonizar todos os parâmetros modificáveis, e fazer com que a saída ANFIS corresponda aos dados de treinamento. Quando os parâmetros de premissa ai, bi e ci da função de associação são fixos, a saída do modelo ANFIS pode ser escrita como wwfffwfwfwwww (11) Em particular, o processo de aprendizagem consiste em uma passagem para a frente e posterior propagação, onde no Passagem direta, os sinais funcionais avançam até a camada 4, e os parâmetros conseqüentes são identificados pela estimativa de mínimos quadrados. Na passagem para trás, as taxas de erro se propagam para trás e os parâmetros da premissa são atualizados pela descida do gradiente. Para valores fixos determinados de S 1, os parâmetros em S 2 encontrados por esta abordagem são garantidos para ser o melhor global. A Tabela 1 fornece um resumo dos métodos de aprendizagem. O erro de saída é usado para adaptar os parâmetros da premissa por meio de um algoritmo padrão de propagação posterior. Tabela 1 Resumo dos diferentes métodos de aprendizagem Passagem direta Passo para trás Parâmetros da premissa Fixed Descida de gradiente Parâmetros conseqüentes LSE Sinais fixos Nó op Taxas de erro Existem quatro métodos usados ​​para atualizar os parâmetros, estes são: 1 descida de gradiente (GD) apenas: todos os parâmetros são atualizados Por descida gradiente. 2 GD e uma passagem de LSE: LSE é aplicada apenas uma vez no início, de modo a obter os valores iniciais dos parâmetros conseqüentes. GD então atualiza. 3 GD e LSE: a regra híbrida proposta (veja também Jang, 1993). 4 apenas LSE seqüencial: usa um filtro Kalman para atualizar os parâmetros. Neste capítulo, com o propósito de usar ANFIS para previsões financeiras, usamos a terceira entrada da lista acima, pois esse método geralmente representa um bom compromisso entre a complexidade computacional e o desempenho resultante (veja também Mitra et al., 2008). 6 Negociação de frequências de alta freqüência intradiária com ANFISs ANFIS para previsões financeiras e negociação O sistema proposto, conforme descrito acima, agora leva a série de preços como entrada, primeiro leva uma certa quantidade de pontos de dados m para treinar e gerando o sistema inicial de inferência difusa a partir dos dados Valores e, em seguida, leva os próximos m pontos de dados para validação. Isso gerará um ANFIS que modificou seus parâmetros e funções de associação e está pronto para produzir uma previsão para os próximos pontos de dados, dado o padrão que reconheceu. A taxa de sucesso desse sistema seria determinada pelo seu nível de precisão na previsão do movimento dos próximos períodos de negociação em segundos, minutos, horas, dias, semanas ou meses, dependendo da frequência de negociação. Tomar as decisões corretas depois de processar todas as entradas de outros blocos também é essencial para um sistema bem-sucedido (Sheen, 2005). Em particular, o sistema considera as três últimas observações de preços no mercado x (t 3), x (t 2), x (t 1) e a observação atual x (t) para prever a próxima observação de preços x (t 1) usando ANFIS. Isso é usado como um indicador de movimento (para cima ou para baixo). Em outras palavras, para fazer uma previsão para t 1, o sistema será alimentado com o preço atual no tempo t mais as observações de preços anteriores t 1, t 2 e t 3, respectivamente. Agora que um sistema para prever o movimento do mercado foi implementado, uma posição adequada pode ser aberta de acordo com o indicador dessa previsão. O pseudo-código é mostrado na Figura 3. Figura 3 Apresentando a posição de retenção quando a predição não muda de direção BEGIN Treine o sistema usando os últimos 500 pontos verifique a precisão dos sistemas usando os últimos 500 pontos REPEAT a partir dos agora até os próximos 100 pontos geram predição TERMINAR o reciclado se a previsão for aumentada - em seguida, compre se a próxima previsão é aumentada - em seguida, segure mais se a previsão for baixa - em seguida, venha se a próxima previsão for baixa - então mantenha a Figura 4 ilustra a estratégia descrita acima, onde as posições de retenção são introduzidas E a frequência de venda de compra é reduzida. Quando a linha vermelha desce (valor falso 0), o sistema está no modo de venda, permanecendo inalterado significa que ele está no modo de espera e o movimento de backup (valor falso 1) significa que ele foi ao modo de compra. Além disso, para aumentar o retorno do investimento de negociação, uma estratégia final de previsão e negociação foi introduzida onde um valor do ponteiro do gatilho é usado. Portanto, para uma seqüência de posições de compra e retenção, se a previsão da próxima vez que a amostra cair abaixo do gatilho definido, a posição é fechada, portanto, uma posição de venda é aberta. O valor do ponteiro do gatilho é atualizado 7 74 A. Kablan e W. L. Ng após cada iteração, conforme ilustrado no pseudo-código na Figura 5. Inicialmente, esse gatilho é definido como o primeiro valor no conjunto de dados. Figura 4 Posições sendo colocadas de acordo com a previsão do movimento (veja a versão online para cores) Figura 5 Apresentando o gatilho para rastrear a predição e detectar mudanças direcionais para ajustar o preço de disparo da posição (1) se a previsão é acima e a predição gt gatilho, em seguida, gatilho Posição de predição (agora-1) comprar outra se a predição é baixa e predição lt gatilho, em seguida, acionar a predição (agora-1) posição vender Após a implementação do sistema ANFIS acima, foram realizados experimentos adicionais para otimizar os resultados obtidos a partir de O sistema acima. Um teste importante que foi realizado envolveu a variação do número de épocas e tamanhos de etapa em cada execução no sistema. Na teoria das redes adaptativas, uma época é definida como uma passagem única através de todo o conjunto de dados (cada conjunto de dados é avaliado uma vez). Isso significa que, quanto mais épocas tivermos, mais avaliações obtemos. No entanto, isso também leva mais tempo. Uma época é uma varredura através de todos os registros no conjunto de dados. Isso não significa que quanto mais épocas tivermos, melhores serão os resultados. Nossos experimentos demonstraram 8 transações FX Intraday de alta freqüência com ANFISs 75 que existe um limiar em que ponto um sistema atingirá saturação e, não importa quantas épocas sejam usadas, o desempenho não melhorará. Na verdade, um número muito grande de épocas resultaria em excesso de treinamento para o sistema, causando uma diminuição no desempenho (ver Figura 6a e 6b). A configuração inicial incluiu um sistema de 80 tempos que levou 18,4 segundos para executar durante cada execução. 1 Experiências para vários números de épocas foram usadas, o que, por sua vez, causou uma alteração na taxa de aprendizado que pode ser analisada nos painéis da Figura 6. O tamanho do passo é considerado como uma variável que é corrigida após cada quarta época, contando Da época em que a correção anterior foi feita. É realizado com base nas seguintes regras: 1 se o erro sofrer quatro reduções consecutivas, então aumente o tamanho da etapa em 10 2 se o erro passar sucessivamente por uma combinação de aumentos e diminuições, então diminua o tamanho da etapa em 10. Finalmente Outra variável é alocada para armazenar a última alteração, que armazena o índice da época na qual o tamanho da etapa variável foi alterado anteriormente. Em geral, não há uma teoria conclusiva para decidir o número de épocas na literatura das redes neurais. No entanto, é uma regra geral para evitar o problema da superposição ao aumentar o número de épocas. Praticamente, observa-se que quanto maior o número de épocas de treinamento melhor, é o desempenho da classificação, mas isso piora a capacidade de generalização pela rede, portanto, a capacidade de prever corretamente os futuros dados de processamento não vistos anteriormente. Isso é confirmado pelos resultados na Tabela 2 na seção empírica abaixo, portanto, escolhemos 80 como um ótimo tamanho de época para uma breve discussão sobre a escolha de números de épocas, veja também Yezioro et al. (2008) e Chelani e Hasan (2001). Figura 6 Curvas de erro e atualização de tamanho de etapa para várias épocas: (a, b) 180 épocas (c, d) 100 épocas (e, f) 50 épocas (g, h) 10 épocas (ver versão online para cores) raiz média quadrada Erro na barra de erro erro quadrado Erro Curvas Treinamento Erro Verificação Erro número da época (a) Erro Curve o número da época (c) Verificação do erro de treinamento Erro tamanho da etapa tamanho da etapa tamanho do passo número da época (b) tamanho da etapa tamanho da curva número (d) 9 76 A Kablan e WL Ng Figura 6 erro quadrático médio quadrado Erro curvas e atualização do tamanho do passo para várias épocas: (a, b) 180 épocas (c, d) 100 épocas (e, f) 50 épocas (g, h) 10 épocas (continuação) (ver Versão on-line para cores) Erro Curvas Treinamento Erro Verificação Erro número de época tamanho do passo tamanho do passo tamanho da curva índice da raiz erro quadrado (e) Erro Curvas Treinamento Erro Verificação Erro número da época (g) tamanho do passo (f) tamanho da etapa tamanho da curva número (h ) 2.3 Sazonalidade intradía Como as atividades de negociação são observadas em tempo real, abordagens comuns para medir a volatilidade, como o desvio padrão, não podem ser aplicadas devido à estrutura de dados não homogênea das séries temporais. Portanto, um modelo de Observação de Sazonalização Intraday (ISOM) como um conceito baseado em eventos para medir a atividade do mercado será usado neste estudo como um proxy para a volatilidade, pois pode mapear as horas do dia com sua respectiva volatilidade. Isso é visto a partir de uma perspectiva baseada em eventos, onde cada mudança direcional com um limite específico é um evento. O objetivo é usar o ISOM para filtrar e limpar esses dados apontando períodos do dia em que a volatilidade excedeu um certo intervalo (número de eventos). A idéia aqui é tomar o número de observações por intervalo de amostragem intradía, a fim de produzir um modelo que estimaria o número de observações médias que ocorrem para a janela do dia do dia (veja também Bauwens et al., 2005). Na negociação financeira, os eventos de mudança direcional (dc) são entendidos como movimentos de preços, onde um movimento de preço total entre dois níveis de preço extremos, expresso como um salto de preço relativo do tamanho de limite dx (), pode ser decomposto em uma reversão de preço ( Ou seja, a própria mudança direcional) e uma seção de sobreposição (Glattfelder et al., 2010). O ISOM para um determinado horário do dia t em um determinado limite dx é igual ao número total de eventos de mudança direcional ocorridos naquela janela de tempo t bin em todo o conjunto de dados: 10 Negociação FX de alta freqüência Intraday com ANFIS 77 n ISOM ( T dx) N (dc t tbin) dia, (12) dia 1 onde n é o número total de dias no conjunto de dados, e N (dc) é o número de mudanças direcionais (eventos). Na sua definição simples, o ISOM é um modelo que leva em consideração um determinado limite dx () e observará os tempos em que as mudanças direcionais dc ocorrem. Analisaria iterativa e consecutivamente todo o conjunto de dados dos preços e salvava as observações em seus respectivos compartimentos de tempo. Isso acabaria por dar um horizonte de sazonalidade, apontando os horários exatos do momento em que essas observações foram feitas. Isso indica os horários do dia em que a volatilidade foi alta ou baixa. A idéia é que os dados serão vistos a partir de uma perspectiva de mudança de direção de mudanças direcionais (eventos), onde cada alteração de porcentagem de atualização dentro de um limite pré-especificado é observada, os carimbos de hora e o preço relativo são marcados e todos os dados são armazenados iterativamente Em valores de tempo de tempo, que serão posteriormente analisados. Para fins de ilustração, quando aplicado com uma mudança de dx 0,05 durante 30 minutos, as janelas para o par estrangeiro (FX) EUR-USD observaram de 04042006 a 04042008. O ISOM resultou no padrão de sazonalidade mostrado na Figura 7. O enredo revela que a maioria dos Os eventos de mudança direcional ocorrem entre as 12:00 e as 14:00 GMT. Isso confirma o fato de que estes são os momentos em que os anúncios são feitos e a reação do mercado a esses anúncios ocorre. É também o momento em que os mercados dos EUA abrem, portanto, a volatilidade dos mercados aumenta. Outros horários de alta volatilidade ocorrem entre as 7:00 e as 8:00 GMT, o que geralmente é o horário antes da abertura dos mercados europeus. Figura 7 ISOM para um limiar de movimento de preço dx 0,5 observado a cada 30 minutos para o par FX EURUSD de 04042006 a 04042008 (veja a versão on-line para cores) O ISOM mostra que, ao considerar as observações a cada 30 minutos, o período com maior volatilidade é entre 12:30 e 13:00 GMT, que é novamente o momento em que todos os anúncios que foram feitos às 12:00 foram absorvidos pelos mercados e os comerciantes começaram a agir sobre eles. O período de maior atividade de negociação ocorre entre as 12:00 e as 16:00 GMT, ou seja, os horários que incluem os anúncios, a abertura dos mercados dos EUA até o fechamento dos mercados europeus. Os resultados acima confirmaram eventos da vida real que são conhecidos por aumentar a volatilidade dos mercados. Eles podem 11 78 A. Kablan e W. L. Ng também ajuda o comerciante ou o sistema a ignorar os períodos que experimentam um número reduzido de eventos. Deve notar-se que o ISOM pode ser aplicado a qualquer limite e qualquer freqüência de tempo (diariamente, meio dia, quarto diário, cinco minutos, etc.). Nós tomamos um limiar de dx 0.05 para o escopo desta ilustração, o conceito pode ser aplicado livremente a qualquer limite ou freqüência de tempo (figuras adicionais que ilustram a sazonalidade intradia para outros valores de limiar são mostradas na Figura 10 no Apêndice). O próximo passo é agora usar o ISOM para filtrar e limpar esses dados indicando períodos do dia em que a volatilidade excedeu um certo intervalo (número de eventos). O modelo ISOM foi redesenhado para atender dados de cinco minutos em vez de dados horários ou de 30 minutos, como mostrado anteriormente. Agora temos caixas de dados de cinco minutos, e vamos capturar as mudanças direcionais à medida que ocorrem dentro dessas caixas, onde o contador de eventos aumentará de acordo com o número de eventos e o número de vezes que o limite foi excedido. Neste estudo, o ANFIS foi alimentado com dados dos horários do dia em que o número de observações excedeu dez eventos. Depois de ser treinado em dados com maior volatilidade (treinamento de estresse), o ANFIS realizará a previsão de um conjunto de dados de verificação. O pseudo-código é mostrado na Figura 8. Figura 8 Otimizando ANFIS com ISOM Função Recolher-ISOM-Times BEGIN para i 2 para finalizar (dados na amostra) calcular a porcentagem mudanças direcionais dc (i) (preço (i) - Preço (i-1) 100) preço (i-1) se abs (dc (i)) gt 0,05 economizar tempo bin observação (T) contagem número de observações para respectivo binário (Tcount) ObservaçõesPerDay Tcountlength (in-sample-data ) Se ObservaçõesPerDay gt 5 ValidISOMTimeBin T termina se final se final para END Função Utilização-ISOM-for-Training-ANFIS BEGIN para k 1 para finalizar (dados fora da amostra) se o tempo ValidISOMTimeBin treinar ANFIS realizar previsões outra vez na próxima vez Final da caixa final para FIN 12 Negociação FX de alta freqüência intradiária com ANFISs 79 3 Dados e resultados empíricos O mercado FX é um mercado mundial de 24 horas com alta liquidez e volatilidade, especialmente nos três principais centros financeiros com influência internacional: Nova York , Londres e Tóquio. A volatilidade é mais alta durante o início da manhã no tempo de Nova York, porque as trocas em Londres e Nova York estão abertas e simultaneamente comerciais. Fatos estilizados, como assimetria de perda de ganho e caudas pesadas, são observados nas distribuições de retorno FX (Bauwens et al., 2005). Bancos comerciais, empresas, instituições financeiras e de varejo de todo o mundo participam da negociação FX. O preço no mercado FX é formado pela compra e venda de moedas para instituições, comerciantes, exportadores, importadores, gestores de portfólio e turistas. Atualmente, as encomendas são combinadas eletronicamente através de terminais automatizados de corretagem. Yoon et al. (1994) afirmam que cerca de 85 de todas as negociações FX ocorrem entre fabricantes de mercado. Isso cria uma oportunidade para a especulação. Neste estudo, os dados FX de alta freqüência amostrados de 04042006 a 04042008 foram alimentados no sistema comercial. Para a análise, calculamos o preço médio dos dados da cotação (Dacorogna et al., 2001). À medida que estamos negociando no FX, a metade do spread, que é o único custo de transação que os comerciantes precisam considerar neste tipo de mercado, já é implicitamente levado em consideração em todas as estratégias relatadas. O sistema foi testado em cinco taxas de câmbio, que são: EUR-USD, AUD-USD, GBP-USD, USD-CHF e USD-JPY. A Figura 9 mostra as diferentes séries temporais que foram utilizadas neste estudo. Figura 9 Série de tempo de todos os cinco pares de moeda FX observados de 04042006 a 04042008, normalizados para 1USD (veja a versão online para cores) Este conjunto de dados original de dados de preço de cinco minutos é dividido em sub-conjuntos de dados (não sobrepostos) com dados m 500 Pontos, para cada uma das taxas de FX. Um m muito pequeno (digamos 100 pontos) pode não ser suficiente para criar impulso e alcançar um número desejado de observações (eventos), já que o limiar não pode ser excedido. Da mesma forma, um número maior pode incluir mais observações que desejamos para uma série do sistema, o que causaria excesso de treinamento e superação (Yeh et al., 2011). Como todas as taxas de freqüência de alta freqüência têm um valor de 13 80 A. Kablan e W. L. Ng quantidade diferente de pontos de dados, m foi escolhido de tal forma que todas as séries têm sub-conjuntos de dados razoavelmente comparáveis. Para cada série de taxas de FX, os primeiros 500 pontos de dados na amostra em cada subconjunto são usados ​​para o treinamento do sistema. Os subseqüentes 500 pontos de dados são considerados fora de amostra e usados ​​para validar o desempenho do sistema e atualizar a estrutura da rede usando o erro de saída. Os 500 pontos de dados que foram utilizados para validação em uma simulação podem ser reutilizados para a reconversão do sistema na próxima simulação, criando assim uma abordagem de janela rolante para treinamento e validação do sistema, aproveitando ao máximo todos os dados disponíveis. Para avaliar o desempenho do modelo proposto, compararemos o ANFIS com as estratégias padrão que são comumente aplicadas na indústria, como comprar e manter, por exemplo, Yeh et al. (2011), p.796, Seção 2.2 ou previsão linear usando sinais de tendência ou sinais de retorno de tendências, e. Schulmeister (2009), pp. Seção 2. Usamos diferentes medidas de avaliação, como por exemplo, a taxa de crescimento do fator de lucro o retorno do investimento (ROI), o índice Sharpe, a razão Sortino. A taxa vencedora simplesmente descreve o número de negociações vencedoras contra o número total de negócios. O fator de lucro descreve principalmente a rentabilidade histórica de uma série de negócios em um investimento. O equilíbrio do fator de lucro é 1, o que significa um investimento que gera negócios com uma chance de 50 da soma bruta de negócios vencedores e uma chance de 50 da soma bruta de negociações perdidas. Normalmente, os investidores escolhem investimentos com o fator de lucro superior a um. O ROI é usado para avaliar a eficiência de um investimento ou comparar os retornos dos investimentos. Ou seja, ROI é a proporção do lucro obtido ou perdido em um investimento em relação ao valor do custo investido. O índice de Sharpe é usado para a medida de retorno ajustado pelo risco de um ativo de investimento ou de uma carteira, o que pode dizer aos investidores como o retorno de um ativo compensa os investidores quanto ao risco assumido. A razão Sharpe é definida como Rp R Sharpe ratio sigma p f, onde R p indica o retorno esperado, R f a taxa de juros livre de risco e sigma p a volatilidade da carteira. Tecnicamente, essa relação mede o prêmio de risco por cada unidade de risco total em um ativo de investimento ou em uma carteira. Os investidores geralmente escolhem investimentos com altos índices de Sharpe, pois quanto maior o índice Sharpe, melhor será o desempenho ajustado ao risco. As there is no risk-free interest rate for intraday maturities, we use the mean return from the training sub-dataset as a substitute. Similarly, the Sortino ratio is defined as Rp Rf Sortino ratio , sigma neg 14 Intraday high-frequency FX trading with ANFISs 81 where sigma neg denotes the standard deviation of only negative asset returns. The main difference between the Sharpe ratio and the Sortino ratio is that the Sortino ratio only penalises the downside volatility, while the Sharpe ratio penalises both upside and downside volatility. Thus, the Sortino ratio measures the risk premium per each unit of downside risk in an investment asset or a portfolio. When training the ANFIS, it has been noticed after running initial experiments that the larger the numbers of epochs, the more stable the system will be because of damping oscillation (see Figure 6). Furthermore, the larger the size of the step, the faster the errors will decrease, although there will be more oscillations. When designing a system that will trade in high frequency, a major category that has to be satisfied along with high performance and optimum results is high speed or run-time and execution. As it can be seen from the Figure 6 and Table 2, a low (high) number of epochs results in a system that is rather fast (slow). On the other hand, a low number of epochs produces very poor results compared to a higher number of epochs, which produces a system with very high performance rates. However, it was also observed from the experiments that as the number of epochs increases, there may be a stage where the performance does not increase as much as required, whereas the time of execution increases drastically. Hence, it is a matter of compromise between speed and performance. This issue can be resolved by choosing a system with 80 epochs, where it has been found to produce the highest performance for the smallest amount of time after conducting extensive experiments (see Table 2). Furthermore, since the system trades on five-minute intervals, a time of seconds cannot be considered a long execution time, given the complexity of the ANFIS design. Having determined the number of epochs to be considered, ANFIS was fed data from the times of day when the number of observations exceeded ten events. After being trained on data with higher volatility (stress training), ANFIS will perform prediction of a set of checking data. Table 2 Num. of epochs Out-of-sample evaluation of the ANFIS system using various numbers of epochs CPU time (secs) Winning rate Profit factor ROI Sharpe ratio Sortino ratio As mentioned before, all sub-datasets used for validation of the implemented trading system is considered as the out-of-sample. The performance measures introduced above are computed for each validation sub-dataset. Table 3 reports the overall average performance measure for 1 the buy and hold 2 the momentum (trend following) 3 the contrarian (trend reversal) 4 the Intraday ANFIS trading strategy. 15 82 A. Kablan and W. L. Ng Table 3 Comparison of the average performance measures in the out-of-sample for all implemented trading strategies FX pair Winning rate Profit factor ROI Sharpe ratio Sortino ratio EUR-USD Buy and hold Momentum Contrarian Intraday ANFIS AUD-USD Buy and hold Momentum Contrarian Intraday ANFIS GBP-USD Buy and hold Momentum Contrarian Intraday ANFIS USD-CHF Buy and hold Momentum Contrarian Intraday ANFIS USD-JPY Buy and hold Momentum Contrarian Intraday ANFIS With respect to the winning rate, Table 3 shows that in most cases, the ANFIS system outperforms the standard strategies in the overall number of wins. In terms of the profit factor, which indicates the actual profitability of a series of trades on an investment, the results show that the ANFIS system also has a profit factor higher than 1 in most cases. Table 3 also reveals that ANFIS generally obtains a higher ROI than the conventional strategies, i. e. it has a higher ratio of profit gained on a trade in relation to the amount of cost invested. Last not least, the Sharpe ratio and Sortino ratio, which measure the investment per unit of risk, also indicate a better performance of the ANFIS model, but less consistent as compared to the other benchmark values. Positive Sharpe and Sortino ratios imply that the trading strategy has not taken high risk. Other descriptive statistics of performance measures in the out-of-sample such as the standard deviation, skewness and kurtosis are listed in Table 4 in the Appendix. It can be seen that in general the performance measures for ANFIS have a lower standard deviation (higher accuracy), higher skewness (higher outperformance) as compared to the 16 Intraday high-frequency FX trading with ANFISs 83 benchmark models. Comparisons for the kurtosis are rather inconsistent, allowing no particular conclusion. Finally, in order to statistically test the performance of a benchmark model (either buy and hold, momentum or contrarian) compared to the proposed ANFIS model, Table 5 in the Appendix lists the test-statistics of the (one tailed) t-test with the null-hypothesis that average measure for the benchmark is better than that for the ANFIS. A negative test-statistic with a value lower than indicates a rejection of the null-hypothesis at a 5 significance level, implying a statistically significant outperformance of the ANFIS strategy. Furthermore, a low positive value of the test-statistic would imply that a particular benchmark model is not significantly better than ANFIS (e. g. Sortino ratios for AUS-USD or USD-JPY). 4 Conclusions The distinctive area of soft computing and artificial intelligence was addressed in this project by revisiting and improving the performance of the ANFIS by manipulating the number of epochs and the learning rate. It was concluded that a certain number of optimal epochs should not be exceeded, since this would not drastically improve the system. The ISOM proposed in this project has been tested on various threshold levels. The observation of a directional change within a threshold leads to taking the time stamp and its consequential addition to all of the observations that have been made during that time. The power of this method lies in the fact that any threshold can be used for any time frequency. This leads to the observation of events for the entire data series from a new perspective. The above concepts of event-driven volatility have proven to be consistent with ANFIS if sufficient data is present to perform the ISOM. A comparison of the proposed model against the standard trading strategies that are commonly applied in the industry shows an outperformance of the Intraday ANFIS. Acknowledgements The authors would like to thank Steve Phelps, Nikos S. Thomaidis (editor) and three anonymous referees for their valuable comments and suggestions that led to an improvement of this paper. References Abonyi, J. Babuscaronka, R. and Szeifert, F. (2001) Fuzzy modeling with multivariate membership functions: gray box identification and control design, IEEE Transactions on Systems, Man, and Cybernetics Part B, Vol. 31, No. 5, pp Aldridge, I. (2009) High-frequency Trading A Practical Guide to Algorithmic Trading Strategies and Trading Systems, Wiley, NJ. Bauwens, L. Omrane, B. and Giot, P. (2005) News announcements, market activity and volatility in the euro-dollar foreign exchange market, Journal of International Money and Finance, Vol. 24, No. 7, pp 17 84 A. Kablan and W. L. Ng Castillo, E. Guijarro-Berdinas, B. Fontenla-Romero, O. and Alonso-Betanzos, A. (2006) A very fast learning method for neural networks based on sensitivity analysis, Journal of Machine Learning Research, Vol. 7, pp Chelani, A. and Hasan, M. (2001) Forecasting nitrogene dioxide concentration in ambient air using artificial neural-networks, International Journal of Environmental Studies, Vol. 58, No. 4, pp Dacarogna, M. Genccedilay, R. Muumlller, U. A. Pictet, O. and Olsen, R. (2001) An Introduction to High-Frequency Finance, Academic Press, San Diego. Dempster, M. A.H. and Jones, C. M. (2001) A real-time adaptive trading system using genetic programming, Quantitative Finance, Vol. 1, No. 4, pp Denaiuml, M. Palis, F. and Zeghbib, A. (2007) Modeling and control of non-linear systems using soft computing techniques, Applied Soft Computing, Vol. 7, No. 3, pp Fontenla-Romero, O. Erdogomus, D. Principe, J. C. Alonso-Betanzos, A. and Castillo, E. (2003) Linear least-squares based methods for neural networks learning, Lecture Notes in Computer Science, Vol. 27142003, No. 173, pp Glattfelder, J. B. Dupuis, A. and Olsen, R. (2010) Patterns in high-frequency FX data: discovery of 12 empirical scaling laws, Working paper, arxiv: v2. Hellstrom, T. and Holmstroumlm, K. (1998) Predicting the stock market, Technical Report Ima-TOM. Center of Mathematical Modeling, Department of Mathematics and Physics, Maumllardalen University, Sweden. Jang, J. R. (1993) ANFIS: adaptive network-based fuzzy inference system, IEEE Transactions on Systems, Man and Cybernetics, Vol. 23, No. 3, pp Jang, J. R. Sun, C. T. and Mizutani, E. (1997) Neuro-Fuzzy and Soft Computing, Prentice Hall, Upper Saddle River, NJ. Kasabov, N. K. and Song, Q. (2002) DENFIS: dynamic evolving neural-fuzzy inference system and its application for time-series prediction, IEEE Transactions on Fuzzy Systems, Vol. 10, No. 2, pp Konstantaras, A. Varley, M. R. Vallianatos, F. Collins, G. and Holifield, P. (2006) Neuro-fuzzy prediction-based adaptive filtering applied to severely distorted magnetic field recordings, IEEE Geoscience and Remote Sensing Letters, Vol. 3, No. 4, pp Mitra, P. Maulik, S. Chowdhury, S. P. and Chowdhury, S. (2008) ANFIS based automatic voltage regulator with hybrid learning algorithm, International Journal of Innovations in Energy Systems and Power, Vol. 3, No. 2, pp.1 5. Murphy, J. (1986) Technical Analysis of Futures Markets, New York Institute of Finance, New York. Schulmeister, S. (2009) Profitability of technical stock trading: has it moved from daily to intraday data. Review of Financial Economics, Vol. 18, No. 4, pp Sewell, M. V. (2010) The application of intelligent systems to financial time series analysis, PhD dissertation, Department of Computer Science, University College London, University of London. Sheen, J. N. (2005) Fuzzy financial decision-making: load management programs case study, IEEE Transactions on Power Systems, Vol. 20, No. 4, pp Takagi, T. and Sugeno, M. (1985) Fuzzy identification of systems and its application to modeling and control, IEEE Transactions on Systems, Man and Cybernetics, Vol. 15, No. 1, pp Yeh, I-C. Lien, C. and Tsai, Y-C. (2011) Evaluation approach to stock trading system using evolutionary computation, Expert Systems with Applications, Vol. 38, No. 1, pp Yezioro, A. Dong, B. and Leite, F. (2008) An applied artificial intelligence approach towards assessing building performance simulation tools, Energy and Buildings, Vol. 40, No. 4, pp 18 Intraday high-frequency FX trading with ANFISs 85 Yoon, Y. Guimaraes, T. and Swales, G. (1994) Integrating artificial neural networks with rule-based expert systems, Decision Support Systems, Vol. 11, No. 5, pp Notes 1 Simulations have been performed on a Toshiba Tecra A9-11M Laptop PC. CPU type: Intel Core 2 Duo, CPU speed: 2.4 GHz, internal memory: 2048 MB, hard drive size: GB. Appendix Figure 10 ISOM for alternative thresholds: (a) threshold 0.2 (b) threshold 0.4 (c) threshold 0.6 (see online version for colours) (a) (b) (c) 19 86 A. Kablan and W. L. Ng Table 4 Descriptive statistics for the performance measures in the out-of-sample for all implemented trading strategies 20 Intraday high-frequency FX trading with ANFISs 87 Table 5 t-tests on significance of the outperformance of the Intraday ANFIS compared to the benchmark models Winning rate Profit factor ROI Sharpe ratio Sortino ratio EUR-USD Buy and hold Momentum Contrarian AUD-USD Buy and hold Momentum Contrarian GBP-USD Buy and hold Momentum Contrarian USD-CHF Buy and hold Momentum Contrarian Intraday ANFIS USD-JPY Buy and hold Momentum Contrarian Notes: This table lists the test-statistics of the (one-tailed) t-test with the null-hypothesis that the average performance of a benchmark model (either buy and hold, momentum or contrarian) is better than that of the ANFIS model, i. e. H 0. micro BENCHMARK micro ANFIS. A negative value lower than indicates a rejection of the null at a 5 significance level.

Comments

Popular Posts