R-quadrado como uma estimativa da qualidade da curva de saldo estratégico.
Índice.
Introdução.
Toda estratégia comercial precisa de uma avaliação objetiva da sua eficácia. Uma ampla gama de parâmetros estatísticos é usada para isso. Muitos deles são fáceis de calcular e mostram métricas intuitivas. Outros são mais difíceis na construção e interpretação de valores. Apesar de toda essa diversidade, há muito poucas métricas qualitativas para estimar um valor não trivial mas, ao mesmo tempo, óbvio - suavidade da linha de saldo do sistema comercial. Este artigo propõe uma solução para este problema. Consideremos uma medida não trivial, como o coeficiente de determinação R-quadrado (R ^ 2), que calcula a estimativa qualitativa da linha de equilíbrio mais atrativa, suave e crescente que cada comerciante deseja.
Claro, o terminal MetaTrader 5 já fornece um relatório de resumo desenvolvido que mostra as principais estatísticas do sistema de negociação. No entanto, os parâmetros apresentados nele não são sempre suficientes. Felizmente, o MetaTrader 5 fornece a capacidade de escrever parâmetros personalizados de estimativa, que é o que vamos fazer. Não só vamos construir o coeficiente de determinação R ^ 2, mas também tentar estimar seus valores, compará-lo com outros critérios de otimização, derivar regularidades seguidas pelas estimativas estatísticas básicas.
Crítica de estatísticas comuns para a avaliação do sistema de negociação.
Toda vez que um relatório comercial é gerado ou os resultados dos backtests do sistema de negociação são estudados, são apresentados vários "números mágicos", que podem ser analisados para tirar conclusões sobre a qualidade do negócio. Por exemplo, um relatório de teste típico no terminal MetaTrader 5 parece assim:
Fig. 1. Resultado de Backtest de uma estratégia de negociação.
Ele contém várias estatísticas ou métricas interessantes. Vamos analisar o mais popular deles e considerar objetivamente seus pontos fortes e fracos.
Lucro líquido total. A métrica mostra o montante total de dinheiro que foi ganho ou perdido durante o período de teste ou comercialização. Este é um dos parâmetros comerciais mais importantes. O principal objetivo de cada comerciante é maximizar o lucro. Existem várias maneiras de fazer isso, mas o resultado final é sempre um, que é o lucro líquido. O lucro líquido nem sempre depende do número de negócios e é praticamente independente de outros parâmetros, embora o contrário não seja verdadeiro. Assim, é invariante em relação a outras métricas e, portanto, pode ser usado independentemente delas. No entanto, esta medida também apresenta graves desvantagens.
Primeiro, o lucro líquido é diretamente dependente de se a capitalização é usada ou não. Quando a capitalização é usada, o lucro cresce de forma não linear. Freqüentemente há um crescimento exponencial e explosivo do depósito. Nesse caso, os números registrados como lucro líquido no final do teste geralmente alcançam valores astronômicos e não têm nada a ver com a realidade. Se um lote fixo é negociado, os incrementos de depósito são mais lineares, mas mesmo nesse caso, o lucro depende do volume selecionado. Por exemplo, se o teste, com o resultado mostrado na tabela acima, foi realizado usando um lote fixo com o volume de 0,1 contato, então o lucro obtido de $ 15.757 pode ser considerado um resultado notável. Se o volume da transação foi de 1,0 lote, o resultado do teste é mais do que modesto. É por isso que os testadores experientes preferem definir muito fixado para 0,1 ou 0,01 no mercado Forex. Neste caso, a variação mínima no saldo é igual a um ponto do instrumento, o que torna a análise desta característica mais objetiva.
Em segundo lugar, o resultado final depende da duração do período testado ou da duração do histórico comercial. Por exemplo, o lucro líquido especificado no quadro acima poderia ter sido recebido em 1 ano ou em 5 anos. E em cada caso, o mesmo valor significa uma eficácia completamente diferente de uma estratégia.
E em terceiro lugar, o lucro bruto é fixado no momento da última data. No entanto, pode haver uma forte retração de capital nesse momento, enquanto que talvez não tenha estado lá há uma semana. Em outras palavras, esse parâmetro é profundamente dependente dos pontos inicial e final selecionados para testar ou gerar o relatório.
Fator de lucro. Esta é sem dúvida a estatística mais popular para os comerciantes profissionais. Enquanto os novatos querem ver apenas o lucro total, os profissionais acham essencial conhecer o volume de negócios dos fundos investidos. Se a perda de um acordo for considerada como tipo de investimento, o fator de lucro mostra a marginalidade da negociação. Por exemplo, se apenas dois negócios são feitos, o primeiro perdeu $ 1000 e o segundo ganhou $ 2000, o Fator de lucro dessa estratégia será $ 2000/1000 = 2.0. Esta é uma figura muito boa. Além disso, o Fator de lucro não depende do período de tempo de teste nem do volume do lote base. Portanto, os profissionais gostam tanto. No entanto, tem desvantagens também.
Um deles é que os valores do Fator de lucro são altamente dependentes da quantidade de negócios. Se houver apenas alguns negócios, obter um fator de lucro igual a 2,0 ou mesmo 3,0 unidades é bem possível. Por outro lado, se houver vários acordos, obter um Fator de Lucro de 1,5 unidades seria um grande sucesso.
Expectativa de pagamento. É uma característica muito importante, indicando o retorno médio da transação. Se a estratégia for rentável, o retorno esperado é positivo; perder estratégias tem um valor negativo. Se o Pagamento Esperado for comparável aos custos de spread ou comissão, a capacidade de tal estratégia para ganhar em uma conta real é duvidosa. Normalmente, o Pagamento Esperado pode ser positivo no Testador de Estratégia sob condições ideais de execução, e o gráfico de balanço pode ser uma linha ascendente suave. No comércio ao vivo, no entanto, o retorno médio do negócio pode ser um pouco pior do que o resultado calculado teoricamente devido a possíveis re-cotações ou derrapagens, que podem ter um impacto crítico no resultado da estratégia e causar perdas reais.
Também tem suas desvantagens. O principal é relacionado à quantidade de negócios também. Se houver poucos negócios, a obtenção de um grande retorno esperado não é um problema. Por outro lado, com um grande número de negócios, o retorno esperado tende a zero. Como é uma métrica linear, não pode ser usada em estratégias que implementam sistemas de gerenciamento de dinheiro. Mas os traders profissionais o consideram altamente e usam em sistemas lineares com um lote fixo, comparando-o com o número de negócios.
Número de ofertas. Esse é um parâmetro importante que afeta a maioria das outras características, explicitamente ou indiretamente. Suponha que um sistema de negociação vença em 70% dos casos. Ao mesmo tempo, os valores absolutos de vitória e perda são iguais, sem outros resultados possíveis de um acordo na tática de negociação. Esse sistema parece ser excelente, mas o que acontece é que a eficiência é avaliada apenas com base nos dois últimos negócios? Em 70% dos casos, um deles será rentável, mas a probabilidade de ambos os negócios serem rentáveis é de apenas 49%. Ou seja, o resultado total de dois negócios será zero em mais da metade dos casos. Consequentemente, em metade dos casos, as estatísticas mostram que a estratégia é incapaz de ganhar dinheiro. Seu fator de lucro será sempre igual a um, Pagamento Esperado e lucro será zero, outros parâmetros também indicarão eficiência zero.
É por isso que o número de negócios deve ser suficientemente grande. Mas o que se entende por suficiência? É geralmente aceito que qualquer amostra deve conter pelo menos 37 medições. Este é um número mágico em estatísticas, que marca o limite inferior da representatividade de um parâmetro. Naturalmente, essa quantidade de negócios não é suficiente para avaliar um sistema de negociação. Pelo menos 100-10 negócios precisam ser feitos para que o resultado seja confiável. Além disso, isso também não é suficiente para muitos comerciantes profissionais. Eles projetam sistemas que fazem pelo menos 500 a 1000 negócios e depois usam esses resultados para considerar a possibilidade de executar o sistema para negociação ao vivo.
Comportamento de parâmetros estatísticos comuns ao testar sistemas de negociação.
Os principais parâmetros nas estatísticas dos sistemas de negociação foram discutidos. Vamos ver o seu desempenho na prática. Ao mesmo tempo, nos concentraremos em suas desvantagens para ver como a adição proposta na forma de estatística R ^ 2 pode ajudar a resolvê-los. Para fazer isso, usaremos o CImpulse 2.0 EA pronto a usar, que é descrito no artigo "Universal Expert Advisor: Use of Pending Orders". Foi escolhido por sua simplicidade e por ser otimizado, ao contrário dos especialistas do pacote padrão MetaTrader 5, que é extremamente importante para os propósitos deste artigo. Além disso, será necessária uma certa infra-estrutura de código, que já foi escrita para o mecanismo comercial CStrategy, portanto, não há necessidade de fazer o mesmo trabalho duas vezes. Todos os códigos-fonte para o coeficiente de determinação estão escritos de forma a que possam ser facilmente utilizados fora do CStrategy - por exemplo, em bibliotecas de terceiros ou especialistas em procedimentos.
Lucro líquido total. Como já mencionado, o lucro líquido (ou total) é o resultado final do que o comerciante quer obter. Quanto maior o lucro, melhor. No entanto, a avaliação de uma estratégia baseada em seu lucro final nem sempre garante o sucesso. Vamos considerar os resultados da estratégia CImpulse 2.0 no par EURUSD para o período de teste de 2015/01/15 a 2017.10.10:
Fig. 2. A estratégia CImpulse, EURUSD, 1H, 2015.01.15 - 2017.10.01, PeriodMA: 120, StopPercent: 0.67.
A estratégia é vista como mostrando um crescimento constante do lucro total nesse intervalo de testes. É positivo e equivale a 11.894 dólares para negociação de um contrato. Este é um bom resultado. Mas deixe-nos ver como se parece um cenário diferente, onde o lucro final é próximo do primeiro caso:
Fig. 3. A estratégia CImpulse, EURUSD, 1H, 2015.01.15 - 2017.10.01, PeriodMA: 110, StopPercent: 0.24.
Apesar de o lucro ser quase o mesmo em ambos os casos, eles parecem sistemas de negociação completamente diferentes. O lucro final no segundo caso também parece aleatório. Se o teste tivesse terminado em meados de 2015, o lucro teria sido próximo de zero.
Aqui está outra corrida mal sucedida da estratégia, com o resultado final, no entanto, também muito perto do primeiro caso:
Fig. 4. CImpulse, EURUSD, 1H, 2015.01.15 - 2017.10.01, PeriodMA: 45, StopPercent: 0.44.
É claro a partir do gráfico que o principal lucro foi recebido no primeiro semestre de 2015. É seguido por um período prolongado de estagnação. Tal estratégia não é uma opção viável para negociação ao vivo.
Fator Lucro. A métrica do fator de lucro é muito menos dependente do resultado final. Esse valor depende de cada negócio e mostra a proporção de todos os fundos conquistados para todos os fundos perdidos. Pode ver-se que na Fig. 2, o Fator de lucro é bastante alto; na Fig. 4, é menor; e na Fig. 3, está quase na fronteira entre sistemas lucrativos e não rentáveis. Mas, no entanto, o fator de lucro não é uma característica universal que não pode ser enganada. Vamos examinar outros exemplos, onde as indicações do Profit Factor não são tão óbvias:
Fig. 5. CImpulse, EURUSD, 1H, 2015.01.15 - 2017.10.01, PeriodMA: 60, StopPercent: 0.82.
A Fig. 5 mostra o resultado de um teste de estratégia executado com um dos maiores valores de fator de lucro. O gráfico do saldo parece bastante promissor, mas a estatística obtida é enganosa, já que o valor do Fator de lucro é exagerado devido ao número muito pequeno de negócios.
Vamos verificar essa afirmação de duas maneiras. O primeiro caminho: descubra a dependência do fator de lucro na quantidade de negócios. Isso é feito otimizando a estratégia CImpulse no testador de estratégia usando uma ampla gama de parâmetros:
Fig. 6. Otimização do ICmpulse usando uma ampla gama de parâmetros.
Salve os resultados da otimização:
Fig. 7. Exportando resultados de otimização.
Agora podemos construir um gráfico de dependência do valor do Fator Lucro no número de negociações. No Excel, por exemplo, isso pode ser feito simplesmente selecionando as colunas correspondentes e pressionando o botão para plotar um gráfico de dispersão na guia Gráficos.
Fig. 8. Dependência do Fator de Lucro no número de negócios.
O gráfico mostra claramente que as corridas com um alto fator de lucro sempre têm muito poucos negócios. Por outro lado, com um grande número de negociações, o fator de lucro é virtualmente igual a um.
A segunda maneira de determinar que os valores do ProfitFactor, nesse caso, dependem do número de negociações e não da qualidade da estratégia está relacionada à realização de um Teste de O uto de Teste (OOS). Aliás, essa é uma das formas mais confiáveis de determinar a robustez dos resultados obtidos. A robustez é uma medida da estabilidade de um método estatístico em estimativas. OOS é eficaz para testar não apenas o ProfitFactor, mas outras indicações também. Para nossos propósitos, os mesmos parâmetros serão selecionados, mas o intervalo de tempo será diferente - a partir de 2012.01.01 a 2015.01.01:
Fig. 9. Testando a estratégia fora da amostra.
Como pode ser visto, o comportamento da estratégia virar a cabeça. Isso gera perda em vez de lucro. Este é um resultado lógico, já que o resultado obtido é quase sempre aleatório com um número tão pequeno de negócios. Isso significa que uma vitória aleatória em um intervalo de tempo é compensada por uma perda em outra, o que é bem ilustrado pela Fig. 9.
Expectativa de pagamento. Não nos deteremos muito nesse parâmetro, porque suas falhas são semelhantes às do Fator de lucro. Aqui está o gráfico de dependência do Pagamento esperado na quantidade de negócios:
Fig. 10. Dependência do Pagamento Esperado no número de negócios.
Pode-se ver que quanto mais negócios forem feitos, menor será o retorno esperado. Essa dependência é sempre observada para estratégias lucrativas e não rentáveis. Portanto, Expected Payoff não pode servir como único critério para a otimização de uma estratégia de negociação.
Requisitos para o critério de teste do sistema de negociação.
Após considerar os principais critérios de avaliação estatística de um sistema de negociação, concluiu-se que a aplicabilidade de cada critério é limitada. Cada um deles pode ser combatido com um exemplo onde a métrica tem um bom resultado, enquanto a estratégia em si não.
Não há critérios ideais para determinar a robustez de um sistema comercial. Mas é possível formular as propriedades que um forte critério estatístico deve ter.
Independência da duração do período de teste. Muitos parâmetros de uma estratégia de negociação dependem de quanto tempo o período de teste é. Por exemplo, quanto maior o período testado para uma estratégia lucrativa, maior o lucro final. Depende da duração e do fator de recuperação. É calculado como a proporção do lucro total para a redução máxima. Uma vez que o lucro depende do período, o fator de recuperação também cresce com o aumento no período de teste. Invariância (independência) em relação ao período é necessária para comparar a eficácia de diferentes estratégias em diferentes períodos de teste; Independência do endpoint de teste. Por exemplo, se uma estratégia "permanece à tona" meramente esperando que as perdas passem, o ponto final pode ter um impacto crucial no saldo final. Se o teste for concluído no momento de tal "overstaying", a perda flutuante (equity) torna-se o saldo e uma retirada significativa é recebida na conta. A estatística deve ser protegida de tal fraude e fornecer uma visão geral objetiva da operação do sistema comercial. Simplicidade de interpretação. Todos os parâmetros do sistema de negociação são quantitativos, ou seja, cada estatística é caracterizada por uma figura específica. Essa figura deve ser intuitiva. Quanto mais simples for a interpretação do valor obtido, mais compreensível será o parâmetro. Também é desejável que o parâmetro esteja dentro de certos limites, uma vez que a análise de números grandes e potencialmente infinitos é muitas vezes complicada. Resultados representativos com um pequeno número de negócios. Este é indiscutivelmente o requisito mais difícil entre as características de uma boa métrica. Todos os métodos estatísticos dependem do número de medidas. Quanto mais, mais estáveis são as estatísticas obtidas. Claro, resolver completamente este problema em uma pequena amostra é impossível. No entanto, é possível atenuar os efeitos causados pela falta de dados. Para este propósito, desenvolvamos dois tipos de função para avaliar R quadrado: uma implementação criará esse critério com base na quantidade de negócios disponíveis. O outro calcula o critério utilizando o lucro flutuante da estratégia (equidade).
Antes de proceder diretamente à descrição do coeficiente de determinação R ^ 2, vamos examinar seus componentes em detalhes. Isso ajudará a entender o propósito desse parâmetro e os princípios nos quais ele se baseia.
Regressão linear.
A regressão linear é uma dependência linear de uma variável y de outra variável independente x, expressada pela fórmula y = ax + b. Nesta fórmula, a é o multiplicador, b é o coeficiente de polarização. Na realidade, pode haver várias variáveis independentes, e esse modelo é chamado de modelo de regressão linear múltipla. No entanto, vamos considerar apenas o caso mais simples.
A dependência linear pode ser visualizada na forma de um gráfico simples. Pegue o gráfico diário EURUSD a partir de 2017.06.21 até 2017.09.21. Este segmento não é selecionado por acaso: durante este período, observou-se uma tendência ascendente moderada neste par de moedas. É assim que fica no MetaTrader:
Fig. 11. Dinâmica do preço EURUSD de 21.06.2017 a 21.08.2017, cronograma diário.
Salve esses dados de preço e use-os para plotar um gráfico, por exemplo, no Excel.
Fig. 12. Taxas EURUSD (preço próximo) como um gráfico no Excel.
Aqui, o eixo Y corresponde ao preço, e X é o número ordinal de medição (as datas foram substituídas por números ordinais). No gráfico resultante, a tendência ascendente é visível a olho nu, mas precisamos obter uma interpretação quantitativa dessa tendência. A maneira mais simples é desenhar uma linha direta, o que se encaixaria com precisão na tendência examinada. É chamado de regressão linear. Por exemplo, a linha pode ser desenhada assim:
Fig. 13. Regressão linear descrevendo uma tendência de alta, desenhada manualmente.
Se o gráfico for bastante suave, é possível desenhar essa linha, que os pontos do gráfico se desviam da distância mínima. E inversamente, para um gráfico com grande amplitude, não é possível escolher uma linha que descreva com precisão suas mudanças. Isso se deve ao fato de que a regressão linear possui apenas dois coeficientes. Na verdade, os cursos de geometria nos ensinaram que dois pontos são suficientes para traçar uma linha. Devido a isso, não é fácil encaixar uma linha reta em um gráfico "curvo". Esta é uma propriedade valiosa que será útil mais adiante.
Mas como descobrir como desenhar uma linha reta corretamente? Os métodos matemáticos podem ser usados para calcular o coeficiente de regressão linear de forma otimizada, de tal forma que todos os pontos disponíveis tenham a soma mínima de distâncias para esta linha. Isso é explicado no gráfico a seguir. Suponha que existam 5 pontos arbitrários e duas linhas passando por eles. Das duas linhas, é necessário selecionar aquele com a menor soma de distâncias para os pontos:
Fig. 14. Seleção da regressão linear mais adequada.
É claro que, das duas variantes de regressão linear, a linha vermelha descreve melhor os dados dados: os pontos # 2 e # 6 estão significativamente mais próximos da linha vermelha do que da linha preta. Os pontos restantes são aproximadamente equidistantes tanto da linha preta quanto do vermelho. Matematicamente, é possível calcular as coordenadas da linha que melhor descrevem essa regularidade. Não vamos calcular esses coeficientes manualmente e usar a biblioteca matemática AlgLib pronta para usar.
Correlação.
Depois que a regressão linear é calculada, é necessário calcular a correlação entre essa linha e os dados para os quais ela é calculada. A correlação é uma relação estatística de duas ou mais variáveis aleatórias. Nesse caso, a aleatoriedade das variáveis significa que as medidas dessas variáveis não são interdependentes. A correlação é medida de -1,0 a +1,0. Um valor próximo a zero indica que as variáveis examinadas não possuem inter-relações. O valor de +1.0 significa uma dependência direta, -1.0 mostra uma dependência inversa. A correlação é calculada por várias fórmulas diferentes. Aqui, o coeficiente de correlação de Pearson será usado:
dx e dy na fórmula correspondem às variâncias calculadas para as variáveis aleatórias xe y. A variação é uma medida da variação da característica. Nos termos mais gerais, pode ser descrito como a soma dos quadrados das distâncias entre os dados e a regressão linear.
O coeficiente de correlação dos dados em sua regressão linear mostra o quão bem a linha reta descreve esses dados. Se os pontos de dados estão localizados a uma grande distância da linha, a variância é alta e a correlação é baixa e vice-versa. A correlação é muito fácil de interpretar: um valor zero significa que não há inter-relação entre a regressão e os dados; um valor próximo a um mostra uma forte dependência direta.
Relatórios no MetaTrader têm uma métrica estatística especial. Chama-se Correlação LR e mostra a correlação entre a curva de equilíbrio e a regressão linear encontrada para essa curva. Se a curva de equilíbrio for suave, a aproximação a uma linha reta será boa. Neste caso, o coeficiente de correlação LR será próximo de 1,0, ou pelo menos acima de 0,5. Se a curva de equilíbrio for instável, as subidas são alternadas por quedas e o coeficiente de correlação tende a zero.
A correlação LR é um parâmetro interessante. Mas em estatísticas, não é costume comparar os dados e a regressão descrita diretamente através do coeficiente de correlação. O motivo para isso será discutido na próxima seção.
Coeficiente de determinação R ^ 2.
O método de cálculo para o coeficiente de determinação R ^ 2 é semelhante ao método de cálculo para a correlação LR. Mas o valor final é adicionalmente ao quadrado. Pode levar valores de 0,0 a +1,0. Esta figura mostra a parcela dos valores explicados da amostra total. A regressão linear serve como um modelo explicativo. Estritamente falando, o modelo explicativo não precisa ser uma regressão linear, outros também podem ser usados. No entanto, os valores de R ^ 2 não requerem processamento adicional para uma regressão linear. Em modelos mais complexos, a aproximação é geralmente melhor e os valores de R ^ 2 devem ser adicionalmente reduzidos por "penalidades" especiais para uma estimativa mais adequada.
Vamos dar uma olhada mais de perto no que o modelo explicativo mostra. Para fazer isso, vamos realizar um pequeno experimento: usar a linguagem de programação especializada R-Project e gerar um passeio aleatório, para o qual o coeficiente requerido será calculado. Random walk é um processo com características bastante semelhantes aos instrumentos financeiros reais. Para obter uma caminhada aleatória, é suficiente adicionar consecutivamente vários números aleatórios distribuídos de acordo com a lei normal.
O código fonte em R com uma descrição detalhada do que está sendo feito:
A função rnorm retorna dados diferentes de cada vez, então, se você quiser repetir esta experiência, o gráfico terá um aspecto diferente.
O resultado do código apresentado:
Fig. 15. Caminhada aleatória e regressão linear para isso.
O gráfico resultante é semelhante ao de um instrumento financeiro arbitrário. Sua regressão linear foi calculada e exibida como uma linha preta do gráfico. À primeira vista, sua descrição da dinâmica da caminhada aleatória é bastante medíocre. Mas precisamos de uma estimativa quantitativa da qualidade da regressão linear. Para o efeito, é utilizada a função 'sumário', que exibe as estatísticas resumidas no modelo de regressão:
Aqui, uma figura é do maior interesse - R-quadrado. Esta métrica indica um valor de 0,5903. Conseqüentemente, a regressão linear descreve 59,03% de todos os valores, e os restantes 41% são inexplicáveis.
Este é um indicador muito sensível que responde bem a uma linha de dados lisa e plana. Para ilustrar isso, vamos continuar o experimento: introduzir um componente de crescimento estável nos dados aleatórios. Para fazer isso, altere o valor médio ou o valor esperado em 1/20 da variância dos dados gerados inicialmente:
O gráfico resultante agora está muito mais próximo de uma linha reta:
Fig. 16. Caminhada aleatória com valor esperado positivo, igual a 1/20 da sua variância.
As estatísticas para isso são as seguintes:
É claro que R-quadrado é significativamente maior e tem um valor de 0.8829. Mas deixe-nos ir para a milha extra e duplique o componente de determinação do gráfico, até 1/10 do desvio padrão dos dados iniciais. O código para processar isso é semelhante ao código anterior, mas com divisão em 10.0 e não em 20.0. O novo gráfico agora é quase totalmente semelhante a uma linha reta:
Fig. 17. Caminho aleatório com valor esperado positivo, igual a 1/10 de sua variação.
Calcule suas estatísticas:
O R-quadrado ficou ainda maior e chegou a 0,9485. Este gráfico é muito parecido com a dinâmica de equilíbrio da desejada estratégia de negociação rentável. Deixe-nos ir para a milha extra novamente. Aumentar o valor esperado até 1/5 do desvio padrão:
Fig. 18. Caminhada aleatória com valor esperado positivo, igual a 1/5 da sua variância.
Tem as seguintes estatísticas:
É claro que R-squared é agora quase igual a um. O gráfico mostra claramente que os dados aleatórios na forma da linha verde quase se encontram completamente na linha reta lisa.
O teorema de arcsine e sua contribuição para a estimação da regressão linear.
Há uma prova matemática de que um processo aleatório acaba se distanciando de seu ponto original. Foi nomeado o primeiro e o segundo teorema do arco seno. Eles não serão discutidos em detalhes, apenas o corolário desses teoremas será definido.
Com base neles, as tendências em processos aleatórios são bastante inevitáveis do que improváveis. Em outras palavras, há mais tendências aleatórias em tais processos do que flutuações aleatórias perto do ponto inicial. Esta é uma propriedade muito importante, o que contribui significativamente para a avaliação das métricas estatísticas. Isto é especialmente evidente para o coeficiente de regressão linear (correlação LR). As tendências são melhor descritas por regressão linear que flats. Isto é devido ao fato de que as tendências contêm mais movimentos em uma direção, que parece linha uma linha suave.
Se houver mais tendências em processos aleatórios que os planos, a LR Correlation também superestimará seus valores em geral. Para ver este efeito não trivial, vamos tentar gerar 10000 caminhadas aleatórias independentes com uma variância de 1,0 e zero valor esperado. Vamos calcular a correlação LR para cada gráfico desse tipo e, em seguida, traçar uma distribuição desses valores. Para esses propósitos, escreva um script de teste simples em R:
O script calcula LR Correlation e R ^ 2. A diferença entre eles será vista mais tarde. Uma pequena adição foi feita ao script. O coeficiente de correlação resultante será multiplicado pelo sinal final do gráfico sintético. Se o resultado final for inferior a zero, a correlação será negativa; caso contrário, é positivo. Isso é feito para separar facilmente e rapidamente os resultados negativos dos positivos sem recorrer a outras estatísticas. É assim que a Correlação LR funciona no MetaTrader 5, o mesmo princípio será usado para R ^ 2.
Então, vamos traçar a distribuição da correlação LR para 10000 amostras independentes, cada uma das quais consiste em 1000 medidas:
O gráfico resultante indica claramente: a correção da definição:
Fig. 19. Distribuição da correlação LR para 10000 passeios aleatórios.
Conforme visto no experimento, os valores de LR-correlação são substancialmente superestimados na faixa de +/- 0,75 - 0,95. Isso significa que a Correlação LR freqüentemente fornece falsamente uma estimativa positiva alta onde não deveria.
Agora, considere como R ^ 2 se comporta na mesma amostra:
Fig. 20. Distribuição de R ^ 2 para 10000 caminhadas aleatórias.
O valor R ^ 2 não é muito alto, embora sua distribuição seja uniforme. É surpreendente como uma ação matemática simples (elevando para o poder de dois) anula completamente os efeitos indesejáveis da ponta da distribuição. Esta é a razão pela qual a Correlação LR não pode ser analisada diretamente - a transformação matemática adicional é necessária. Além disso, note que R ^ 2 move uma fração significativa dos saldos virtuais analisados de estratégias para um ponto próximo de zero, enquanto a LR-Correlation dá-lhes estimativas médias estáveis. Esta é uma propriedade positiva.
Coletando a equidade da estratégia.
Agora que a teoria foi estudada, resta implementar o R-quadrado no terminal MetaTrader. Claro, podemos ir pelo caminho fácil e calculá-lo para as ofertas na história. No entanto, uma melhoria adicional será introduzida. Como mencionado anteriormente, qualquer parâmetro estatístico deve ser resistente a um pequeno número de negócios. Infelizmente, o R-quadrado pode infundir o seu valor injustificadamente se houver apenas alguns negócios na conta, como qualquer outra estatística. Para evitar isso, calcule-o com base nos valores do patrimônio - lucro flutuante. A idéia por trás disso é que, se a EA faz apenas 20 negócios por ano, é muito difícil estimar sua eficiência. Seu resultado é muito provável aleatório. Mas se o saldo desse EA for medido em uma periodicidade especificada (por exemplo, uma vez por hora), haverá uma quantidade razoável de pontos para traçar a estatística. Neste caso, haverá mais de 6000 medições.
Além disso, essa medida neutraliza sistemas que não consertam sua perda flutuante, o que o esconde. O drawdown por patrimônio está presente, mas não pelo saldo. Uma estatística calculada com base no saldo não avisa sobre problemas ocorridos. No entanto, uma métrica calculada com base no lucro / perda flutuante reflete a situação objetiva na conta.
A equidade da estratégia será coletada de forma não convencional. Isso porque a coleta desses valores requer dois pontos principais a serem levados em conta:
Frequência da coleta de estatísticas Determinação de eventos, recebimento que exige que o patrimônio seja verificado.
Por exemplo, um Expert Advisor funciona apenas por timer, no período de tempo H1. É testado no modo "Apenas preços de abertura". Portanto, os dados para esta EA não podem ser coletados mais de uma vez por hora e a triagem desses dados pode ser realizada somente quando o evento OnTimer é gerado. A solução mais eficaz é simplesmente usar o poder do mecanismo CStrategy. O fato é que a CStrategy recolhe todos os eventos em um único manipulador de eventos e ele monitora o cronograma necessário automaticamente. Assim, a solução optima é escrever uma estratégia de agente especial, que calcula todas as estatísticas necessárias. Ele será criado pelo gerenciador de estratégia do CManagerList. A turma só adicionará seu agente à lista de estratégias, que monitorará as alterações na conta.
O código-fonte deste agente é fornecido abaixo:
O próprio agente consiste em dois métodos: OnEvent redefinido e um método para retornar os valores patrimoniais. Aqui, o principal interesse é na classe CTimeSeries, que aparece no CStrategy pela primeira vez. É uma tabela simples, com os dados adicionados no formato: data, valor, número da coluna. Todos os valores armazenados são classificados por hora. A data necessária é acessada por meio de pesquisa binária, o que acelera substancialmente o trabalho com a coleção. The OnEvent method checks if the current event is the opening of a new bar, and if so, simply stores the new equity value.
R^2 reacts to a situation where there are no deals for a long time. At such times, the unchanged equity values will be recorded. The equity graph forms a so-called "ladder". To prevent this, the method compares the value with the previous value. If the values match, the record is skipped. Thus, only the changes in equity fall into the list.
Let us integrate this class to the CStrategy engine. Integration will be performed from above, at the level of CStrategyList. This module is suitable for calculation of custom statistics. There can be several custom statistics. Therefore, an enumeration listing all possible statistic types is introduced:
The enumeration above shows that the custom optimization criterion has three types: R-squared based on the result of trades, R-squared based on the equity data and no calculation of statistics.
Add the ability to configure the type of custom calculation. To do this, supply the CStrategyList class with additional SetCustomOptimaze * methods:
Each of these methods sets the value of its internal variable of ENUM_CUSTOM_TYPE to m_custom_type and the second parameter, equal to the correlation type ENUM_CORR_TYPE:
This additional parameters must be mentioned separately. The fact is that R^2 is none other but the correlation between the graph and its linear model. However, the correlation type itself may differ. Use the AlgLib mathematical library. It supports two methods for calculating the correlation: Pearson's and Spearman's. Pearson's formula is classic and well-suited to homogeneous, normally distributed data. Spearman's Rank-Order correlation is more resistant to price spikes, which are often observed on the market. Therefore, our calculation will allow working with each variant of calculating R^2.
Now that all data are prepared, proceed to the calculation of R^2. It is moved to separate functions:
They will be located in a separate file named RSquare. mqh. The calculation is arranged in the form of functions, so that users would be able to easily and quickly include this calculation mode in their project. In this case, there is no need to use CStrategy. For example, to calculate R^2 in your expert, simply redefine the OnTester system function:
When it is necessary to calculate the strategy equity, however, users who do not employ CStrategy will have to do it themselves.
The last thing that needs to be done in CStrategyList is to define the OnTester method:
Now consider the implementation of functions CustomR2Equity and CustomR2Balance .
Calculating the coefficient of determination R^2 using AlgLib.
The coefficient of determination R^2 is implemented using AlgLib — a cross-platform library of numerical analysis. It helps calculate various statistical criteria, from simple to the most advanced ones.
Here are the steps for calculating the coefficient.
Get the values of equity and convert them into matrix M[x, y], where x is the number of measurement, y is the equity value. For the obtained matrix, calculate the a and b coefficients of the linear regression equation.
These steps are performed by the CustomR2Equity function. Its source code is presented below:
This code refers to three statistical methods: CAlgLib::LRLine, CAlglib::PearsonCorr2 and CAlglib::SpearmanCorr2. The main one is CAlgLib::LRLine, which directly calculates the linear regression coefficients.
Now let us describe the second function for calculating R^2: CustomR2Balance. As the name implies, this function calculates the value based on the deals made. All its work lies in forming an array of the double type, which contains the dynamics of balance, by iterating over all deals in history.
Once the array is formed, it is passed to the CustomR2Equity function mentioned earlier. In fact, the CustomR2Equity function is universal. It calculates the R^2 value for any data contained in the equity[] array, whether it is the balance dynamics or the value of the floating profit.
The last step is a small modification in the code of the CImpulse EA, namely, the override of the OnTester system event:
This function sets the type of the custom parameter, and then returns its value.
Now we can see the calculated coefficient in action. Once the CImpulse strategy backtest starts, the parameter will appear in the report:
Fig. 21. The value of R^2 as a custom optimization criterion.
Using the R-squared parameter in practice.
Now that R-squared is built-in as a custom optimization criterion, it is time to try it out in practice. This is done by optimizing CImpulse on the М15 timeframe of the EURUSD currency pair. Save the received optimization result to an Excel file, and then use the obtained statistics to compare several runs selected according to different criteria.
The complete list of optimization parameters is provided below:
The range of the EA parameters is listed in the table:
After the optimization, an optimization cloud was obtained, consisting of 722 variants:
Fig. 22. Optimization cloud of CImpulse, symbol - EURUSD, timeframe - H1.
Select the run with the maximum profit and display its balance graph:
Fig. 23. Balance graph of the strategy selected according to the criterion of the maximum profit.
Now find the best run according to the R-square parameter. For this, compare the optimization runs in the XML file. If Microsoft Excel is installed on the computer, the file will be opened in it automatically. The work will involve sorting and filters. Select the table title and press the button of the same name (Home -> Sort & Filter -> Filter). This allows customizing the display of columns. Sort the runs according to the custom optimization criterion:
Fig. 24. Optimization runs in Microsoft Excel, sorted by R-squared.
The first row in the table will have the best R-squared value of the entire sample. In the figure above, it is marked in green. This set of parameters in the strategy tester gives a balance graph that looks as follows:
Fig. 25. Balance graph of a strategy selected according to the criterion of the maximum R-squared value.
The qualitative difference between these two balance graphs is visible to the naked eye. While the test run with the maximum profit "broke down" in December 2015, the other variant with the maximum R^2 continued its steady growth.
Often R^2 depends on the number of deals, and may usually overestimate its values on small samples. In this respect, R-squared correlates with Profit Factor. On certain strategy types, a high value of Profit Factor and a high value of R^2 go together. However, this is not always the case. As an illustration, select a counter-example from the sample, demonstrating the difference between R^2 and Profit Factor. The figure below shows a strategy run having one of the highest Profit Factor values equal to 2.98:
Fig. 26. Test run of a strategy with Profit Factor equal to 2.98.
The graph shows that, even though the strategy shows a steady growth, the quality of the strategy balance curve is still lower than the one with the maximum R-squared.
Advantages and limitations of use.
Each statistical metric has its pros and cons. R-squared is no exception in this regard. The table below presents its flaws and solutions that can mitigate them:
Let us describe the problem of applying R^2 to nonlinear systems (for example, a trading strategy with a dynamic lot) in more detail.
The primary objective of every trader is the maximization of profit. A necessary condition for this is the use of various capitalization systems. Capitalization system is the transformation of a linear process into a nonlinear one (for example, into an exponential process). But such a transformation renders most of the statistical parameters meaningless. For example, the "final profit" parameter is meaningless for capitalized systems, since even a slight shift in the time interval testing or changing a strategy parameter by a hundredth of a percent can change the final result by tens or even hundreds of times.
Other parameters of the strategy lose their meaning as well, such as Profit Factor, Expected Payoff, the maximum profit/loss, etc. In this sense, R-squared is no exception either. Created for linear estimation of the balance curve smoothness, it becomes powerless in evaluation of nonlinear processes. Therefore, any strategy should be tested in a linear form, and only after that a capitalization system should be added to the selected option. It is better to evaluate nonlinear systems using special statistical metrics (for example, GHPR) or to calculate the yield in annual percentages.
Conclusão.
The standard statistical parameters for evaluating trading systems have known drawbacks, which must be taken into account. Among the standard metrics in MetaTrader 5, only LR Correlation is designed to estimate the smoothness of the strategy balance curve. However, its values are often overestimated.
Thus, it is safe to say that the coefficient of determination R-squared is an important addition to the existing set of the MetaTrader 5 testing metrics. It allows estimating the smoothness of a strategy's balance curve, which is a nontrivial indicator on its own. R-squared is easy to use: its values are bound to the range of -1.0 to +1.0, signaling about a negative trend in the strategy balance (values close to -1.0), no trend (values close to 0.0) and a positive trend (values tending to +1.0). Thanks to all these properties, reliability and simplicity, R-squared can be recommended for use in building a profitable trading system.
Traduzido do russo pela MetaQuotes Software Corp.
Confirming Price Trend.
by Barbara Star, PhD Here's a technique using linear regression slope and r-squared to confirm the price trend.
L inear regression is a statistical method some traders use to filter the static, or "noise," created by day-to-day or bar-to-bar price movements. Using the least-squares method, it minimizes the amount of deviation among price values to determine a best-fit line. In an earlier STOCKS & COMMODITIES article, I showed that applying a linear regression indicator to price creates less lag and more trading opportunities than a moving average of the same length.
As useful as the linear regression indicator is for detecting price shifts, two other outputs derived from a linear regression may hold equal value for traders. In this article I will introduce two lesser-known indicators, r-squared and linear regression slope, which can serve as useful adjuncts when determining price trend and price direction.
R-squared is a measure of association. It measures the proportion of explained variation between the linear regression and the underlying data it is tracking. For traders that means the r-squared calculation identifies how closely the linear regression indicator matches the underlying price movement; the higher the r-squared value, the greater the correlation with the trending component of price. The eSignal code can be found in sidebar 1, "eSignal code for r-squared."
The length of lookback parameter chosen plays a role in determining the numeric level at which r-squared assumes a positive correlation with the underlying linear regression and price movement at the statistical 95% confidence level; the shorter the r-squared length, the higher the r-squared level needed. For instance, a 10-period r-squared reaches a positive correlation at the 0.40 level, while a 50-period only needs to exceed a 0.08 level.
While there is no standard default parameter for the r-squared length in trading, it should correspond to the underlying linear regression length. I find that a 20- to 30-period r-squared indicator works well for end-of-day trading purposes. The 20-period r-squared, which reaches a positive correlation at 0.20, will be used throughout the examples in this article.
R-squared moves on a scale of zero to 1.0. A rising r-squared indicates strength of association with a price that is trending, while declining r-squared readings suggest a weak or weakening correlation between linear regression and price.
The price chart of Nicor in Figure 1 contains an overlay of a 20-period linear regression on price and a 20-period r-squared indicator in the bottom panel. The red arrows on the price chart show when the rising r-squared indicator reached or slightly exceeded the 0.20 levels.
In general, when r-squared rises from a low level (for example, zero, 0.01, or 0.02), it serves as an alert that price may be entering or resuming a trending condition. On the Nicor chart, the blue arrows on the indicator following points 1, 2, and 3 show a rising r-squared. However, as the arrows on the price chart also illustrate, a rising r-squared does not necessarily correspond to rising prices. From the low levels at 1 and 3 the indicator rose as did price, but this was not the case at point 2, when a rising r-squared was followed by falling prices.
. Continued in the December issue of Technical Analysis of STOCKS & COMMODITIES.
Excerpted from an article originally published in the December 2007 issue of Technical Analysis of.
STOCKS & amp; COMMODITIES magazine. Todos os direitos reservados. &cópia de; Copyright 2007, Technical Analysis, Inc.
R-quadrado (R2)
A linha Tendência de Regressão Linear aproxima o ponteiro dos dados reais pode ser bem descrita pelo indicador R-Squared ou R2. É observado um ajuste perfeito, quando um R-Squared está em 1.0 ponto. No entanto, quando o R-Squared é inferior a 1,0 ponto, isso significa que não há relações entre o preço e a linha Linear Regression Trend.
Quando R-Squared arredondou em níveis extremos, uma posição de curto prazo poderia ser considerada a abertura oposta à tendência predominante. Por exemplo, uma posição curta pode ser considerada como vendendo ou abrindo, quando a inclinação é positiva e o ponto 0.80 é superado por R-quadrado, então ele começa a diminuir.
Você pode encontrar muitas maneiras de usar os resultados de regressão linear de R-squared e Slope em sistemas de negociação. Se você precisar de mais informações sobre o R-Squared, lê-lo no livro The New Technical Trader escrito por Stanley Kroll e Tushar Chande.
R & amp; D Blog.
I. Estratégia de negociação.
Conceito: estratégia de tendência seguinte baseada em uma inclinação de regressão linear. Fonte: Kaufman, P. J. (2005). Novos sistemas de negociação e métodos. Nova Jersey: John Wiley & amp; Sons, Inc. Objetivo de pesquisa: verificação do desempenho do modelo de regressão linear aplicado ao longo de dois tempos. Especificação: Tabela 1. Resultados: Figura 1-2. Carteira: 42 mercados de futuros de quatro principais setores de mercado (commodities, moedas, taxas de juros e índices de participação). Dados: 33 anos desde 1980. Plataforma de teste: MATLAB®.
II. Teste de sensibilidade.
Todos os gráficos 3-D são seguidos por gráficos de contorno bidimensionais para Fator de lucro, Ratio de Sharpe, Índice de Desempenho de Úlcera, CAGR, Drawdown Máximo, Percentagem de Negociações Rentáveis e Média. Win / Avg. Rácio de perda. A imagem final mostra a sensibilidade da Equity Curve.
Tested Variables: Look_Back & Look_Back_Index (Definições: Tabela 1):
Figura 1 | Desempenho do portfólio (Entradas: Tabela 1, Comissão e Slippage: $ 0).
onde: Y é a dimensão do preço (preços de fechamento), X é a dimensão do tempo, AvgX é o valor médio de X i e AvgY é o valor médio de Y i.
LRS_1: Regressão linear Slope durante o período Look_Back usado como um filtro.
LRS_2: Inclinação de Regressão Linear sobre o período Look_Back × Look_Back_Index usado para gerar sinais.
Look_Back_Index = [0.2, 1.0], Passo = 0.02;
Operações curtas: inclinação de regressão linear LRS_1 [i-1] & lt; 0.
Negociações curtas: uma venda no aberto é colocada quando LRS_1 [i-1] & lt; 0 e LRS_2 [i-1] & lt; 0.
Look_Back_Index = [0.2, 1.0], Step = 0.02.
ATR_Stop = 6 (ATR.
Faixa verdadeira média
Tabela 1 | Especificação: Estratégia de negociação.
III. Teste de sensibilidade com a Comissão & amp; Slippage.
Tested Variables: Look_Back & Look_Back_Index (Definições: Tabela 1):
Figura 2 | Desempenho do portfólio (Entradas: Tabela 1, Comissão e Slippage: $ 100 Round Turn).
IV. Classificação: Inclinação Linear de Regressão | Estratégia de negociação.
REGRA CFTC 4.41: RESULTADOS DE DESEMPENHO HIPOTÉTICOS OU SIMULADOS TÊM CERTAS LIMITAÇÕES. DESEJO UM REGISTRO DE DESEMPENHO REAL, OS RESULTADOS SIMULADOS NÃO REPRESENTAM A NEGOCIAÇÃO REAL. TAMBÉM, DESDE QUE OS NEGÓCIOS NÃO FORAM EXECUTADOS, OS RESULTADOS PODERÃO TER COMPRIMIDO COM COMPENSADO PARA O IMPACTO, SE QUALQUER, DE CERTOS FATORES DE MERCADO, COMO FALTA DE LIQUIDEZ. PROGRAMAS DE NEGOCIAÇÃO SIMULADOS EM GERAL SÃO TAMBÉM SUJEITOS AO FATO QUE ESTÃO DESIGNADOS COM O BENEFÍCIO DE HINDSIGHT. NENHUMA REPRESENTAÇÃO ESTÁ FAZENDO QUE QUALQUER CONTA VOCE OU POSSIBILIDADE DE ALCANÇAR LUCROS OU PERDAS SIMILARES ÀOS MOSTRADOS.
DIVULGAÇÃO DE RISCOS: GOVERNO DOS ESTADOS UNIDOS EXERCÍCIOS RENÚNCIA | REGRA CFTC 4.41.
Nós compartilhamos o que aprendemos.
Inscreva-se para receber notícias de pesquisa e ofertas exclusivas.
R-Squared.
What is 'R-Squared'
R-squared is a statistical measure that represents the percentage of a fund or security's movements that can be explained by movements in a benchmark index. For example, an R-squared for a fixed-income security versus the Barclays Aggregate Index identifies the security's proportion of variance that is predictable from the variance of the Barclays Aggregate Index. The same can be applied to an equity security versus the Standard and Poor's 500 or any other relevant index.
BREAKING DOWN 'R-Squared'
R-squared values range from 0 to 1 and are commonly stated as percentages from 0 to 100%. An R-squared of 100% means all movements of a security are completely explained by movements in the index. A high R-squared, between 85% and 100%, indicates the fund's performance patterns have been in line with the index. A fund with a low R-squared, at 70% or less, indicates the security does not act much like the index. A higher R-squared value indicates a more useful beta figure. For example, if a fund has an R-squared value of close to 100% but has a beta below 1, it is most likely offering higher risk-adjusted returns.
R-Squared Calculation Example.
The calculation of R-squared requires several steps. First, assume the following set of (x, y) data points: (3, 40), (10, 35), (11, 30), (15, 32), (22, 19), (22, 26), (23, 24), (28, 22), (28, 18) and (35, 6).
To calculate the R-squared, an analyst needs to have a "line of best fit" equation. This equation, based on the unique date, is an equation that predicts a Y value based on a given X value. In this example, assume the line of best fit is: y = 0.94x + 43.7.
With that, an analyst could compute predicted Y values. As an example, the predicted Y value for the first data point is:
y = 0.94(3) + 43.7 = 40.88.
The entire set of predicted Y values is: 40.88, 34.3, 33.36, 29.6, 23.02, 23.02, 22.08, 17.38, 17.38 and 10.8. Next, the analyst takes each data point's predicted Y value, subtracts the actual Y value and squares the result. For example, using the first data point:
Error squared = (40.88 - 40) ^ 2 = 0.77.
The entire list of error's squared is: 0.77, 0.49, 11.29, 5.76, 16.16, 8.88, 3.69, 21.34, 0.38 and 23.04. The sum of these errors is 91.81. Next, the analyst takes the predicted Y value and subtracts the average actual value, which is 25.2. Using the first data point, this is:
(40.88 - 25.2) ^ 2 = 15.68 ^ 2 = 245.86. The analyst sums up all these differences, which in this example, equals 763.52.
Lastly, to find the R-squared, the analyst takes the first sum of errors, divides it by the second sum of errors and subtracts this result from 1. In this example it is:
R-squared = 1 - (91.81 / 763.52) = 1 - 0.12 = 0.88.
LRS + R-Squared = A solução de 95%.
Não, isso não tem nada a ver com Sherlock Holmes. Tem muito a ver com a inclinação de regressão linear, r-quadrado e como combinados podem dizer se a tendência é forte.
IMPORTANCE OF SLOPE.
The linear regression method provides several useful outputs for technical analysis, one of which is slope. A inclinação mostra a quantidade de preços que se espera que alterem por unidade de tempo & # 8212; Ou seja, com que rapidez os preços podem mudar. Uma inclinação íngreme indica uma taxa de troca rápida. Um declive raso indica uma taxa de mudança lenta. Quando a inclinação da tendência se torna significativamente positiva, você pode abrir uma posição longa com alguma garantia de que a tendência continuará. When the slope first becomes significantly negative, you could close your long position, or open a short position, for similar reasons.
No entanto, enquanto a inclinação dá-lhe a direção da tendência (seja positiva ou negativa), como muitos outros indicadores, não dá nenhuma medida de quão forte é a tendência. É útil, portanto, considerar a inclinação em relação ao r-quadrado, o que indica a força da tendência. A high r - squared value, combined with a high positive or negative slope, gives you some confidence that a strong trend is developing.
Embora seja útil conhecer o valor r - squared, idealmente, você deve usar r - squared em paralelo com inclinação. Os altos valores de rsquared acompanhados por uma pequena inclinação podem não interessar os comerciantes de curto prazo. No entanto, valores elevados de rsquared acompanhados por um grande valor de declive podem ser de grande interesse. The r - squared indicator can be used successfully as a confirming indicator. Indicadores baseados em momentos como stochastics, índice de força relativa (RSI), índice de canal de commodities (CCI), e assim por diante e os sistemas de média móvel exigem confirmação de tendência para serem considerados confiáveis. R - squared fornece um meio de quantificar a força das tendências de preços. Se r - squared estiver acima de seu valor crítico e encaminhado, você pode ter 95% de confiança de que uma forte tendência está presente.
Ao usar indicadores baseados em momentum, você só deve negociar níveis de sobrecompra / sobrevenda se você tiver determinado que os preços são de tendência ou enfraquecendo (isto é, os preços têm um valor baixo ou menor de rsquared). Esteja ciente de que, em um mercado fortemente tendencial, os preços podem permanecer sobre comprados ou sobrevendidos por períodos prolongados. Portanto, você pode querer analisar todos os sistemas de negociação que dependem estritamente dos níveis de sobrecompra / sobrevenda e considere adicionar os indicadores LRS / rsquared.
COMO VOCÊ USA ISSO?
Figure 1 shows the value of r - squared used to determine when a trend is significant. Esta tabela mostra os valores de r - squared necessários para um nível de confiança de 95% em vários períodos de tempo. Por exemplo, se a inclinação de 14 períodos virou recentemente de negativo para positivo (ou seja, cruzou acima de zero), você pode considerar comprar quando r - squared cruza acima do nível 0.27. Para determinar se a tendência é estatisticamente significativa para uma dada linha de regressão linear de período de x, trace o indicador r - squared para o mesmo período de tempo e consulte a tabela. Se o valor for menor do que os valores críticos mostrados, você deve assumir que os preços não apresentam uma tendência estatisticamente significante.
Figura 1: R-quadrado. Aqui você vê valores usados para determinar quando uma tendência é considerada significativa.
Destaquei os períodos de 14 e 30 dias, que vou demonstrar. (Para calcular o valor crítico para qualquer período de tempo, veja a barra lateral, "Parâmetros R-quadrado".) O período refere-se a qualquer período de tempo que você estiver usando na análise do gráfico. If you are plotting daily charts, your period will be in days. Se você estiver planejando dados semanais, seu período será em semanas. Os parâmetros para a inclinação da regressão linear são o número de períodos de tempo a serem usados ao calcular o indicador eo campo de preço (isto é, o aberto, alto, baixo, próximo ou mesmo uma média, como (H + L) / 2) . O parâmetro para r - squared é meramente o período de tempo, o que, claro, deve corresponder à inclinação. You may consider opening a short-term position opposite the prevailing trend when you observe the slope rounding off at extreme levels. Por exemplo, se a inclinação estiver em um nível relativamente alto e começar a diminuir, você pode considerar fechar sua posição longa ou abrir uma posição curta. You may consider opening a short-term position opposite the prevailing trend when you observe r - squared rounding off at extreme levels. Por exemplo, se a inclinação for positiva e r-quadrado estiver acima de 0,80, mas começa a diminuir, você pode considerar vender ou abrir uma posição curta.
A Figura 2, um gráfico da IBM, é superado com uma média móvel de 14 dias. As setas mostram o cruzamento da inclinação acima de zero e r-quadrado cruzando acima do limite de 0,27. This pattern augured well for the sustained uptrend, which lasted approximately three months.
No system is infallible, however; sempre haverá falsos sinais. Note no ponto X que alguma decisão de gerenciamento de dinheiro teria que ser feita. Se você tivesse um sistema mecânico que fechasse sua posição longa em uma queda fixa fixa no preço, então você poderia cortar seu lucro curto. If you were monitoring the price using your favorite indicators for confirmation and no sell signal was given, you might have gotten past the glitch. Observe também, em janeiro, que a inclinação cruzou abaixo do limiar zero, significando uma tendência de baixa. Seguiu-se o cruzamento em quadrado quadrado acima do seu limiar em um ângulo íngreme, significando uma forte tendência (funciona em qualquer direção). A IBM caiu cerca de 20% em duas semanas.
Figura 2: indicadores LRS / r-quadrado de 14 períodos. Notice price action when the threshold levels are crossed.
In Figure 3 you see a chart of Intel (INTC) with a 30-day moving average displayed. Novamente, as setas mostram os indicadores cruzando acima de zero e o limite de 0,133. This pattern presaged a nice uptrend that lasted approximately three and a half months with a 40% gain.
Figure 3: 30-period LRS/r-squared indicators. Você poderia ter feito um ganho de 40% durante um período de três meses e meio.
Embora esses gráficos mostrem uma boa tendência após a confirmação da combinação slope / rsquared, seria cansativo ter que percorrer seu portfólio para encontrar esses padrões de gráfico. Em vez disso, você deseja configurar uma pesquisa para os estoques que exibem os padrões. The following is an example that uses MetaStock's Explore function. Pesquisas semelhantes podem ser configuradas em muitos outros programas, como TradeStation, AIQ TradingExpert Pro e TC2000.
The Explore function in MetaStock allows seven columns of parameters, along with a filter that sets the logic for the search. I based my search on the closing price to set up the following exploration. The logic for the 14-period search is:
Filter: ColB>0 AND ColC>0.27 AND ColC>ColD.
A lógica para a pesquisa de 30 dias é a mesma, exceto substituindo 30 por 14 e 0,13 por 0,27.
A Figura 4 é uma captura de tela de uma exploração de 14 dias. Fora de uma lista de 37, apenas essas ações preenchiam os parâmetros do filtro. A ColA mostra o preço de fechamento na data da exploração, a ColB mostra os valores de inclinação (todos acima de zero), o ColC mostra o valor de r - squared (tudo acima de 0,27), e o ColD mostra o valor r - squared de ontem. O filtro remove qualquer estoque da lista cujo valor r - squared é menor do que o de ontem. The remaining stocks are the ones to check to see if your favorite indicators confirm the LRS/ r - squared indicators. A quick comparison of ColD versus ColC gives you a heads-up of which stock's r - squared has increased the most in one day (for example, CVS).
Figure 4: Results of a 14-period LRS/r-squared exploration. Observe que apenas alguns estoques atendem aos parâmetros do filtro.
Note-se que uma leitura rsquared excepcionalmente alta (por exemplo, 0,8) pode indicar uma situação de sobrecompra e uma possível desaceleração. Se os osciladores adicionais estão indicando uma desaceleração, isso não seria um bom sinal de entrada. Conversely, if r - squared is just crossing above the threshold and other confirming indicators are displaying similar characteristics, it might be a very good buy signal. This technique is discussed in few technical analysis books. Experimente na sua lista de observação e troque-a até decidir se é para você.
Rudy Teseo ensinou cursos de negociação de opções e os conceitos básicos de gráficos de ações. Entre em contato com ele no rftessjuno.
SUGGESTED READING.
MetaStock (Equis International)
Veja nosso glossário cumulativo online.
Observe que os parâmetros r - squared estão em proporção inversa aos períodos de tempo. It is only necessary to remember one time period/critical value combination from which all critical values may be calculated. Por exemplo, note que um período de 10 requer um valor crítico de 0,40. Para calcular o valor crítico por um período de 50, por exemplo, a proporção de 10/50 é 1/5 e 1/5 de 0,40 é 0,08. Reduzir outros cálculos para duas casas decimais.
Current and past articles from Working Money, The Investors' Magazine, can be found at Working-Money.
Direitos autorais e cópia; 1982 & ndash; 2018 Technical Analysis, Inc. Todos os direitos reservados. Leia nosso aviso e amp; declaração de privacidade.
No comments:
Post a Comment