Precisa de Excel Consulting e serviços de mineração de dados Você está diante de qualquer um desses desafios A necessidade de criar uma macro do Excel para fazer uma tarefa importante Um trabalho repetitivo no Excel que leva horas ou dias para fazer manualmente Ser solicitado a criar uma macro do Excel para resolver um Necessidade importante A necessidade de converter dados em bruto em formato Excel útil A necessidade de criar uma macro do Excel para uso de muitas pessoas em sua empresa Um prazo apertado Nossos serviços incluem, mas não estão limitados a: Relatório de Programação de Banco de Dados Relatório de Automação Manipulação de Dados e Mercado de Base de Dados de Conversão Auditoria de dados Excel VBA Programação de dados de limpeza de dados Mineração e previsão Integração de dados Modelagem financeira Query Calculator e ferramentas Funções personalizadas do Excel Folha de cálculo e design de banco de dados Se você for, podemos ajudá-lo. Podemos: Realizar com tarefas de qualidade que vão do simples ao difícil. Sugerir melhorias e aprimoramentos. Faça isso para pequenos e grandes empregos. Faça isso a um custo razoável. Entregue a macro rapidamente e no horário. Leia mais Faça o próximo passo e contate-nos. Leva apenas alguns minutos: use nosso formulário de contato para contatar-nos sobre nossos serviços de consultoria e dados da Excel. Dê uma breve descrição de sua necessidade. Bem, entre em contato com você dentro de horas na maioria dos casos. Testemunhos Excel Business Solutions fornece suporte confiável e profissional quando se trata de desenvolver ferramentas para gerentes de projetos em nossa empresa. O fato de Anthony e sua equipe conseguir fornecer soluções para tarefas complexas o torna um especialista em TI de valor incalculável. Eu recomendo Excel Business Solutions - Batoor Khan, ATB Áustria - O Excel Business Solutions aumentou para todos os desafios que eu lhes dediquei, adaptando soluções para nossos requisitos únicos, tornando o EXCEL mais funcional para nossos analistas. - Dr. Stephen St. George-Smith, PICR, Reino Unido - Anthony e sua equipe conseguiram criar tabelas dinâmicas muito potentes e fáceis de usar que ajudaram no desenvolvimento de nossa análise comercial. - Joe C. Stone Oak Underwriters, LLC. EUA. - Excel Business Solutions me salvou tempo, dinheiro e frustração. As pessoas inteligentes cercam-se de pessoas competentes. - Jim H. Whitman County Assessors Office. EUA - Obrigado a Anthony por suas habilidades experientes do Excel e tempo de resposta incrível. Eu vim chamá-lo de meu Gênio da TI e lhe dei vários projetos que produziram consistentemente resultados excelentes. Encontrando-o através de uma pesquisa na Internet era como encontrar ouro em um palheiro. Obrigado novamente. - Lee. Lei Altschuler. EUA - Um dos nossos clientes high-tech Fortune 100 nos entregou um relatório muito complicado e nos pediu para torná-lo mais fácil de usar. Excel Business Solutions forneceu uma solução elegante para uma tarefa muito desafiadora. Eles superaram nossas expectativas e nosso cliente ficou desapontado - Sparky Witte, Kolar Advertising Marketing. EUA - Como a programação do Excel funciona para você Desde 1993, o Excel incluiu o Visual Basic for Applications (VBA), uma linguagem de programação baseada no Visual Basic, que adiciona a capacidade de automatizar tarefas no Excel e fornecer funções definidas pelo usuário (UDF) para uso Em planilhas. O VBA é uma adição poderosa ao Excel. As macros do Excel são programas que armazenam uma série de comandos que você pode reproduzir as ações. Eles podem reduzir o número de etapas necessárias para completar tarefas e reduzir significativamente o tempo que os usuários passam a criar, formatar, modificar e imprimir suas planilhas. Uma macro pode ser tão simples como replicar algumas tarefas de formatação ou tão complexas como consultar informações de várias fontes de dados por meio da programação de banco de dados. Exemplo: um analista financeiro baixa tabelas financeiras da Internet todos os dias para análises e geração de relatórios. Ela cobre 30 ações para a indústria de computadores. A cada dia, ele escolhe os números das tabelas, realiza algumas análises de rácios financeiros e insere os índices em diferentes relatórios. Ela tem que fazer essas tarefas repetitivas para cada uma das 30 empresas que ela cobre. Essas tarefas ocupam a maior parte do tempo no escritório. Com a ajuda de um serviço de consultoria, ela agora pode completar todos os relatórios em minutos, dando-lhe mais tempo para escrever seus relatórios e relaxar. Qualidade de dados refere-se à qualidade dos dados. Os dados são de alta qualidade se forem adequados aos seus usos previstos nas operações, na tomada de decisões e no planejamento (J. M. Juran). Alternativamente, os dados são considerados de alta qualidade se representarem corretamente a construção do mundo real a que se referem. Um estudo da indústria estimou o custo total para a economia dos EUA de problemas de qualidade de dados em mais de US $ 600 bilhões por ano (Eckerson, 2002). Na verdade, o problema é uma preocupação porque as empresas estão começando a criar uma equipe de governança de dados cujo único papel na corporação seja responsável pela qualidade dos dados. Embora a maioria das empresas tende a concentrar seus esforços de qualidade em informações sobre nomes e endereços, a qualidade dos dados é reconhecida como uma propriedade importante de todos os tipos de dados. O processo de qualidade dos dados pode incluir alguns ou todos os seguintes: Perfil de dados - inicialmente avaliando os dados para entender seus desafios de qualidade. Padronização de dados - um mecanismo de regras de negócios que garante que os dados estejam em conformidade com as regras de qualidade. Correspondência ou Ligação - uma maneira de comparar dados para que registros semelhantes, mas ligeiramente diferentes, possam ser alinhados. A correspondência pode usar lógica difusa para encontrar duplicatas nos dados. Muitas vezes, reconhece que Bob, Bobby, Rob e Robert podem ser o mesmo indivíduo. Monitoramento - acompanhamento da qualidade dos dados ao longo do tempo e relatórios de variações na qualidade dos dados. A mineração de dados descobre padrões em dados usando técnicas preditivas. Esses padrões desempenham um papel crítico na tomada de decisões. Usando a mineração de dados, empresas e organizações podem aumentar a lucratividade de seus negócios, descobrindo oportunidades e detectando riscos potenciais. A previsão é um componente da mineração de dados. É o processo de estimação em situações desconhecidas. Previsão é um termo similar mas mais geral, e geralmente se refere a estimativa de séries temporais, dados transversais ou longitudinais. A previsão é comumente usada na discussão de dados da série temporal. Exemplo: um método de mineração de dados usado por um meio-mercado do Midwest para analisar os padrões de compra locais. Eles descobriram que quando os homens compravam fraldas nas quintas e sábados, eles também costumavam comprar cerveja. Mais análises mostraram que esses compradores normalmente faziam compras semanais aos sábados. Na quinta-feira, no entanto, eles apenas compraram alguns itens. O varejista concluiu que comprou a cerveja para disponibilizá-la no próximo final de semana. A cadeia de compras poderia usar essa informação recentemente descoberta de várias maneiras para aumentar a receita. Por exemplo, eles poderiam mover o visor de cerveja mais perto da exibição de fraldas. E, eles poderiam garantir que cerveja e fraldas fossem vendidas a preço total às quintas-feiras. O marketing de banco de dados enfatiza o uso de técnicas estatísticas e análises de dados para desenvolver modelos de comportamento do cliente, que são usados para selecionar clientes para comunicações. O benefício do marketing de banco de dados é a capacidade de direcionar seus esforços de marketing. As empresas podem concentrar seu esforço de marketing em clientes com maior probabilidade de comprar. Exemplo: uma empresa de marketing na Internet patrocina uma feira comercial em Houston. Em vez de enviar convites a milhares de seus clientes em todo os Estados Unidos, a empresa faz uma consulta em seu banco de dados de marketing e extrai uma lista de clientes localizados na área metropolitana de Houston. A empresa então envia seu pacote de convite para esta lista segmentada. Microsoft Excel e VBA Excel é uma poderosa folha de cálculo que permite armazenar, manipular, analisar e visualizar dados. Possui uma interface intuitiva e ferramentas de cálculo e gráficos capazes, que fizeram do Excel uma das aplicações de microcomputadores mais populares até à data. É, sobrecarregado, o aplicativo de planilha dominante disponível para essas plataformas e tem sido assim desde a versão 5 em 1993 e seu agrupamento como parte do Microsoft Office. O Excel incluiu Visual Basic for Applications (VBA), uma linguagem de programação baseada no Visual Basic, que adiciona a capacidade de automatizar tarefas no Excel e para fornecer funções definidas pelo usuário (UDF) para uso em planilhas. O VBA é uma adição poderosa à aplicação que, em versões posteriores, inclui um ambiente de desenvolvimento integrado totalmente desenvolvido (IDE). A gravação de macro pode produzir o código VBA replicando as ações dos usuários, permitindo assim a automatização simples das tarefas regulares. O VBA permite a criação de formulários e controles na planilha para se comunicar com o usuário. O idioma suporta o uso (mas não a criação) de DLLs ActiveX (COM) versões posteriores adicionam suporte para módulos de classe permitindo o uso de técnicas básicas de programação orientada a objeto (OOP). Mais informações Base de dados Marketing O marketing de banco de dados é uma forma de marketing direto usando bancos de dados de Clientes ou clientes potenciais para gerar comunicações personalizadas para promover um produto ou serviço para fins de marketing. O método de comunicação pode ser qualquer meio endereçável, como no marketing direto. A distinção entre marketing direto e banco de dados decorre principalmente da atenção dada à análise de dados. O marketing de banco de dados enfatiza o uso de técnicas estatísticas para desenvolver modelos de comportamento do cliente, que são usados para selecionar clientes para comunicações. Como conseqüência, os comerciantes de banco de dados também tendem a ser usuários pesados de armazéns de dados, porque ter uma maior quantidade de dados sobre clientes aumenta a probabilidade de um modelo mais preciso ser construído. Mais informações Previsão Análise Previsão é o processo de estimação em situações desconhecidas. Previsão é um termo similar, mas mais geral, e geralmente se refere a estimativa de séries temporais, dados transversais ou longitudinais. A previsão é comumente usada na discussão de dados da série temporal. Os métodos da série temporal usam dados históricos como base para estimar os resultados futuros. Mídia em movimento Suavização exponencial Extrapolação Previsão linear Estimativa da tendência Curva de crescimento Alguns métodos de previsão utilizam a hipótese de que é possível identificar os fatores subjacentes que podem influenciar a variável que está sendo prevista. Por exemplo, as vendas de guarda-chuvas podem estar associadas às condições climáticas. Se as causas forem compreendidas, as projeções das variáveis de influência podem ser feitas e usadas na previsão. Análise de reação usando regressão linear ou regressão não-linear. Média móvel autorregressiva (ARMA) Média móvel integrada autoregressiva (ARIMA), e. Econometria Box-Jenkins Em estatísticas, a análise de regressão é o processo usado para estimar os valores dos parâmetros de uma função, na qual a função prediz o valor de uma variável de resposta em termos de valores de outras variáveis. Existem muitos métodos desenvolvidos para se adequar às funções e esses métodos geralmente dependem do tipo de função que está sendo usada. Um modelo de média móvel integrada autorregressiva (ARIMA) é uma generalização de uma média móvel autorregressiva ou modelo (ARMA). Esses modelos são adaptados aos dados das séries temporais para melhor compreender os dados ou para prever futuros pontos da série. O modelo é geralmente referido como um modelo ARIMA (p, d, q) onde p, d e q são números inteiros maiores ou iguais a zero e referem-se à ordem das partes médias autorregressivas, integradas e móveis do modelo respectivamente. Mais informações Mineração de dados A mineração de dados é o processo de busca automática de grandes volumes de dados por padrões. Geralmente é usado por empresas e outras organizações, mas é cada vez mais utilizado nas ciências para extrair informações dos enormes conjuntos de dados gerados pela experimentação moderna. Embora a mineração de dados seja um termo relativamente novo, a tecnologia não é. Empresas por um longo tempo usaram computadores poderosos para peneirar volumes de dados, como dados de scanner de supermercado, e produzir relatórios de pesquisa de mercado. Inovações contínuas no poder de processamento de computadores, armazenamento em disco e software estatístico aumentam dramaticamente a precisão e a utilidade da análise. A mineração de dados identifica tendências dentro de dados que vão além da análise simples. Através do uso de algoritmos sofisticados, os usuários têm a capacidade de identificar os principais atributos dos processos de negócios e oportunidades de destino. O termo mineração de dados é freqüentemente usado para se candidatar aos dois processos separados de descoberta e previsão de conhecimento. A descoberta de conhecimento fornece informações explícitas que têm um formato legível e podem ser entendidas por um usuário. A previsão ou modelagem preditiva fornece previsões de eventos futuros e pode ser transparente e legível em algumas abordagens (por exemplo, sistemas baseados em regras) e opaca em outras, como redes neurais. Além disso, alguns sistemas de mineração de dados, como as redes neurais, são inerentemente orientados para a previsão e não para a descoberta de conhecimento. Mais informações Limpeza de dados A mineração de dados é o processo de busca automática de grandes volumes de dados por padrões. Geralmente é usado por empresas e outras organizações, mas é cada vez mais utilizado nas ciências para extrair informações dos enormes conjuntos de dados gerados pela experimentação moderna. Embora a mineração de dados seja um termo relativamente novo, a tecnologia não é. Empresas por um longo tempo usaram computadores poderosos para peneirar volumes de dados, como dados de scanner de supermercado, e produzir relatórios de pesquisa de mercado. Inovações contínuas no poder de processamento de computadores, armazenamento em disco e software estatístico aumentam dramaticamente a precisão e a utilidade da análise. A mineração de dados identifica tendências dentro de dados que vão além da análise simples. Através do uso de algoritmos sofisticados, os usuários têm a capacidade de identificar os principais atributos dos processos de negócios e oportunidades de destino. O termo mineração de dados é freqüentemente usado para se candidatar aos dois processos separados de descoberta e previsão de conhecimento. A descoberta de conhecimento fornece informações explícitas que têm um formato legível e podem ser entendidas por um usuário. A previsão ou modelagem preditiva fornece previsões de eventos futuros e pode ser transparente e legível em algumas abordagens (por exemplo, sistemas baseados em regras) e opaca em outras, como redes neurais. Além disso, alguns sistemas de mineração de dados, como as redes neurais, são inerentemente orientados para a previsão e não para a descoberta de conhecimento. Mais informações Integração de dados A integração de dados é o processo de combinação de dados que residem em diferentes fontes e fornece ao usuário uma visão unificada desses dados. Este processo emerge em uma variedade de situações comerciais (quando duas empresas similares precisam fundir seus bancos de dados) e científicas (combinando resultados de pesquisa de diferentes repositórios de bioinformática). A integração de dados aparece com o aumento da freqüência, pois o volume e a necessidade de compartilhar dados existentes explodem. Tem sido o foco de um vasto trabalho teórico e inúmeros problemas abertos ainda não foram resolvidos. Na prática de gerenciamento, a integração de dados é freqüentemente chamada Enterprise Information Integration. Steps na escolha de um modelo de previsão. O modelo de previsão deve incluir recursos que capturam todas as propriedades qualitativas importantes dos dados: padrões de variação no nível e tendência, efeitos da inflação e sazonalidade, Correlações entre variáveis, etc. Além disso, os pressupostos subjacentes ao seu modelo escolhido devem concordar com sua intuição sobre como as séries provavelmente se comportam no futuro. Ao montar um modelo de previsão, você possui algumas das seguintes opções: estas opções são descritas brevemente abaixo. Consulte o Diagrama de fluxo de previsão que acompanha uma visão pictórica do processo de especificação do modelo e consulte o painel Estatística do modelo de estatística para ver como os recursos do modelo são selecionados no software. Deflação Se a série mostra crescimento inflacionário, a deflação ajudará a explicar o padrão de crescimento e reduzir a heteroscedasticidade nos resíduos. Você pode (i) desinflar os dados passados e reinflar as previsões de longo prazo a uma taxa assumida constante, ou (ii) desinflar os dados passados por um índice de preços como o CPI e, em seguida, quotmanually reintroduzir as previsões de longo prazo usando Uma previsão do índice de preços. A opção (i) é a mais fácil. No Excel, você pode simplesmente criar uma coluna de fórmulas para dividir os valores originais pelos fatores apropriados. Por exemplo, se os dados forem mensais e você deseja desinflar a uma taxa de 5 por 12 meses, você dividiria por um fator de (1.05) (k12) onde k é o índice de linha (número de observação). RegressIt e Statgraphics possuem ferramentas integradas que fazem isso automaticamente para você. Se você seguir esta rota, geralmente é melhor definir a taxa de inflação assumida igual à sua melhor estimativa da taxa atual, especialmente se você vai prever mais de um período à frente. Se em vez disso você escolher a opção (ii), primeiro você deve salvar as previsões deflacionadas e os limites de confiança para a planilha de dados, gerar e salvar uma previsão do índice de preços e, finalmente, multiplicar as colunas apropriadas. (Voltar ao topo da página.) Transformação do logaritmo Se a série mostra o crescimento composto e ou um padrão sazonal multiplicativo, uma transformação de logaritmo pode ser útil além do ou defasar a deflação. O registro de dados não irá esticar um padrão de crescimento inflacionário, mas ele irá corrigi-lo para que ele possa ser ajustado por um modelo linear (por exemplo, uma caminhada aleatória ou modelo ARIMA com crescimento constante ou um modelo de alisamento exponencial linear). Além disso, o logon converte padrões sazonais multiplicativos em padrões aditivos, de modo que, se você efetuar um ajuste sazonal após o registro, você deve usar o tipo de aditivo. Logging lida com a inflação de forma implícita, se você deseja que a inflação seja modelada explicitamente - ou seja. Se você quiser que a taxa de inflação seja um parâmetro visível do modelo ou se você quiser visualizar parcelas de dados desinflados - então você deve desinflar ao invés de registrar. Outro uso importante para a transformação de log é linearizar relações entre variáveis em um modo de regressão l. Por exemplo, se a variável dependente for uma função multiplicativa e não aditiva das variáveis independentes, ou se a relação entre variáveis dependentes e independentes for linear em termos de mudanças percentuais em vez de mudanças absolutas, aplicando uma transformação de log a uma ou mais variáveis Pode ser apropriado, como no exemplo de vendas de cerveja. (Voltar ao topo da página.) Ajuste sazonal Se a série tiver um padrão sazonal forte que se acredite ser constante de ano para ano, o ajuste sazonal pode ser uma maneira apropriada de estimar e extrapolar o padrão. A vantagem do ajuste sazonal é que ele modela o padrão sazonal explicitamente, dando-lhe a opção de estudar os índices sazonais e os dados dessazonalizados. A desvantagem é que requer a estimativa de um grande número de parâmetros adicionais (particularmente para dados mensais) e não fornece nenhum raciocínio teórico para o cálculo de quotcorrectquot intervalos de confiança. A validação fora da amostra é especialmente importante para reduzir o risco de sobreposição dos dados passados através do ajuste sazonal. Se os dados são fortemente sazonais, mas você não escolhe o ajuste sazonal, as alternativas são para (i) usar um modelo ARIMA sazonal. Que, implicitamente, prevê o padrão sazonal com atrasos e diferenças sazonais, ou (ii) usa o modelo de suavização exponencial sazonal dos Invernos, que estima índices sazonais variáveis no tempo. (Voltar ao topo da página.) Quot Variáveis independentes Se existem outras séries de tempo que você acredita ter poder explicativo em relação à sua série de interesse (por exemplo, indicadores econômicos líderes ou variáveis de política, como preço, publicidade, promoções, etc.) você Pode considerar a regressão como seu tipo de modelo. Independentemente de você escolher a regressão, você ainda precisa considerar as possibilidades mencionadas acima para transformar suas variáveis (deflação, registro, ajuste sazonal e talvez também diferenciando) para explorar a dimensão do tempo e linearizar os relacionamentos. Mesmo que você não escolha a regressão neste momento, você pode considerar adicionar regressores mais tarde a um modelo de séries temporais (por exemplo, um modelo ARIMA) se os resíduos tiverem correlações cruzadas significativas com outras variáveis. (Retornar ao topo da página.) Caminho de alisamento, média ou aleatório Se você escolheu ajustar os dados de forma sazonal - ou se os dados não são sazonais para começar -, então você pode querer usar um modelo de média ou suavização para Ajustar o padrão não-sazonal que permanece nos dados neste momento. Um modelo simples de movimentação exponencial simples ou média móvel meramente calcula uma média local de dados no final da série, assumindo que esta é a melhor estimativa do valor médio atual em torno do qual os dados estão flutuando. (Estes modelos assumem que a média da série está variando lentamente e aleatoriamente sem tendências persistentes.) O alisamento exponencial simples é normalmente preferido para uma média móvel simples, porque sua média ponderada exponencial faz um trabalho mais sensato de descontar os dados mais antigos, porque é O parâmetro de alisamento (alfa) é contínuo e pode ser facilmente otimizado, e porque possui uma base teórica subjacente para computar intervalos de confiança. Se o suavização ou a média não parecer útil - ou seja. Se o melhor preditor do próximo valor da série temporal é simplesmente seu valor anterior - então um modelo de caminhada aleatória é indicado. Este é o caso, por exemplo, se o número ótimo de termos na média móvel simples for 1 ou se o valor ótimo de alfa no alisamento exponencial simples for 0.9999. O alisamento exponencial linear dos Browns pode ser usado para caber uma série com tendências lineares que variam lentamente, mas seja cauteloso sobre extrapolar essas tendências muito para o futuro. (Os intervalos de confiança que aumentam rapidamente para este modelo testemunham a sua incerteza sobre o futuro distante.) O suavização linear de Holts também estima tendências variáveis no tempo, mas usa parâmetros separados para suavizar o nível e a tendência, o que geralmente proporciona um ajuste melhor aos dados Do que o modelo Brown8217s. As tentativas de suavização exponencial uadratic tentam estimar as tendências quadráticas variáveis no tempo e nunca devem ser usadas praticamente. (Isso corresponderia a um modelo ARIMA com três ordens de diferenciação não sazonal.) O alisamento exponencial linear com uma tendência amortecida (ou seja, uma tendência que se aplana em horizontes distantes) é frequentemente recomendado em situações em que o futuro é muito incerto. Os vários modelos de suavização exponencial são casos especiais de modelos ARIMA (descritos abaixo) e podem ser equipados com o software ARIMA. Em particular, o modelo de suavização exponencial simples é um modelo ARIMA (0,1,1), o modelo de suavização linear Holt8217s é um modelo ARIMA (0,2,2) e o modelo de tendência amortecida é um ARIMA (1,1,2 ) modelo. Um bom resumo das equações dos vários modelos de suavização exponencial pode ser encontrado nesta página no site da SAS. (Os menus SAS para especificar modelos de séries temporais também são mostrados ali). Os modelos de linha de tendência linear, quadrática ou exponencial são outras opções para extrapolar uma série dessazonalizada, mas eles raramente superam a caminhada, alisamento ou Modelos ARIMA sobre dados empresariais. (Retornar ao topo da página.) Winters Seasonal Exponential Smoothing Winters Seasonal Smoothing é uma extensão do alisamento exponencial que simultaneamente calcula fatores de variação, tendência e fatores sazonais que variam no tempo usando equações recursivas. (Assim, se você usar esse modelo, você não ajustaria os dados de forma temporária). Os fatores sazonais de Winters podem ser multiplicativos ou aditivos: normalmente você deve escolher a opção multiplicativa, a menos que tenha registrado os dados. Embora o modelo Winters seja inteligente e razoavelmente intuitivo, pode ser complicado aplicar na prática: possui três parâmetros de alisamento - alfa, beta e gama - para alisar separadamente os fatores de nível, tendência e sazonal, que devem ser estimados simultaneamente. A determinação dos valores iniciais para os índices sazonais pode ser feita aplicando o método médio-ajustado de ajuste sazonal em relação a parte ou a totalidade das séries e ou por backforecast. O algoritmo de estimativa que Statgraphics usa para esses parâmetros, por vezes, não converge nem produz valores que proporcionam previsões e intervalos de confiança de aparência estranha, então eu recomendaria cautela ao usar este modelo. (Voltar ao topo da página.) ARIMA Se você não escolhe o ajuste sazonal (ou se os dados não são sazonais), você pode querer usar a estrutura do modelo ARIMA. Os modelos ARIMA são uma classe muito geral de modelos que inclui modos de caminhada aleatória, tendência aleatória, suavização exponencial e autoregressiva como casos especiais. A sabedoria convencional é que uma série é um bom candidato para um modelo ARIMA se (i) pode ser estacionada por uma combinação de diferentes transformações matemáticas, como o log, e (ii) você tem uma quantidade substancial de dados para trabalhar com : Pelo menos 4 temporadas completas no caso de dados sazonais. (Se a série não puder ser adequadamente estacionada por diferenciação - por exemplo, se for muito irregular ou parece estar alterando qualitativamente o seu comportamento ao longo do tempo - ou se tiver menos de 4 estações de dados, você poderá estar melhor com um modelo Que usa o ajuste sazonal e algum tipo de média ou suavização simples). Os modelos ARIMA possuem uma convenção de nomeação especial introduzida pela Box e Jenkins. Um modelo ARIMA não-sazonal é classificado como um modelo ARIMA (p, d, q), onde d é o número de diferenças não-sazonais, p é o número de termos autorregressivos (atrasos da série diferenciada) e q é o número de diferenças de movimento, Termos médios (atrasos dos erros de previsão) na equação de predição. Um modelo ARIMA sazonal é classificado como ARIMA (p, d, q) x (P, D, Q). Onde D, P e Q são, respectivamente, o número de diferenças sazonais, termos autorregressivos sazonais (atrasos da série diferenciada em múltiplos do período sazonal) e termos médios móveis sazonais (atrasos dos erros de previsão em múltiplos do período sazonal período). O primeiro passo na montagem de um modelo ARIMA é determinar a ordem apropriada de diferenciação necessária para estacionar a série e remover as características brutas da sazonalidade. Isso equivale a determinar qual modelo de caminhada aleatória ou modelo aleatório fornece o melhor ponto de partida. Não tente usar mais de 2 pedidos totais de diferenciação (não sazonal e combinado sazonal) e não use mais de 1 diferença sazonal. O segundo passo é determinar se deve incluir um termo constante no modelo: geralmente você inclui um termo constante se a ordem total de diferenciação for 1 ou menos, caso contrário você não. Em um modelo com uma ordem de diferenciação, o termo constante representa a tendência média nas previsões. Em um modelo com duas ordens de diferenciação, a tendência nas previsões é determinada pela tendência local observada no final da série temporal, e o termo constante representa a tendência da tendência, ou seja, a curvatura do longo prazo, Previsões de longo prazo. Normalmente, é perigoso extrapolar tendências de tendências, então você suprime o termo contant no presente caso. O terceiro passo é escolher o número de parâmetros de média autorregressiva e móvel (p, d, q, P, D, Q) que são necessários para eliminar qualquer autocorrelação que permaneça nos resíduos do modelo ingênuo (ou seja, qualquer correlação que permaneça após Mera diferenciação). Esses números determinam o número de atrasos da série diferenciada e os atrasos dos erros de previsão incluídos na equação de previsão. Se não houver autocorrelação significativa nos resíduos neste ponto, então STOP, você está feito: o melhor modelo é um modelo ingênuo Se houver autocorrelação significativa nos intervalos 1 ou 2, você deve tentar configurar q1 se uma das seguintes se aplica: ( I) há uma diferença não sazonal no modelo, (ii) a autocorrelação de lag 1 é negativa. Andor (iii) o gráfico de autocorrelação residual é mais limpo (menos picos mais isolados) do que o gráfico de autocorrelação parcial residual. Se não houver diferença não sazonal no modelo e ou a autocorrelação de lag 1 é positiva e ou a parcela de autocorrelação parcial residual parece mais limpa, então tente p1. (Às vezes, essas regras para escolher entre p1 e q1 conflitam umas com as outras, caso em que provavelmente não faz muita diferença qual você usa. Experimente-as e compare.) Se houver autocorrelação no intervalo 2 que não é removido pela configuração p1 Ou q1, você pode tentar p2 ou q2, ou ocasionalmente p1 e q1. Mais raramente, você pode encontrar situações em que p2 ou 3 e q1, ou vice-versa, produz os melhores resultados. É altamente recomendável que você não use pgt1 e qgt1 no mesmo modelo. Em geral, ao montar os modelos ARIMA, você deve evitar aumentar a complexidade do modelo para obter apenas pequenas melhorias adicionais nas estatísticas de erro ou a aparência das parcelas ACF e PACF. Além disso, em um modelo com pgt1 e qgt1, existe uma boa possibilidade de redundância e não singularidade entre os lados AR e MA do modelo, conforme explicado nas notas sobre a estrutura matemática do modelo ARIMA s. Geralmente, é melhor prosseguir de forma progressiva, em vez de retroceder passo a passo quando ajustar as especificações do modelo: comece com modelos mais simples e adicione apenas mais termos se houver uma necessidade clara. As mesmas regras se aplicam ao número de termos autorregressivos sazonais (P) e ao número de termos de média móvel sazonal (Q) em relação à autocorrelação no período sazonal (por exemplo, atraso 12 para dados mensais). Tente Q1 se já houver uma diferença sazonal no modelo e ou a autocorrelação sazonal é negativa ou a parcela de autocorrelação residual parece mais limpa na proximidade do intervalo sazonal, caso contrário tente P1. (Se é lógico que a série exiba uma sazonalidade forte, então você deve usar uma diferença sazonal, caso contrário, o padrão sazonal desaparecerá ao fazer previsões de longo prazo.) Ocasionalmente, você pode tentar P2 e Q0 ou vice v ersa, Ou PQ1. No entanto, é altamente recomendável que o PQ nunca seja superior a 2. Os padrões sazonais raramente têm o tipo de regularidade perfeita ao longo de um número suficientemente grande de estações que permitiria identificar e estimar de forma confiável muitos parâmetros. Além disso, o algoritmo de backforecast que é usado na estimação de parâmetros provavelmente produzirá resultados não confiáveis (ou mesmo loucos) quando o número de estações de dados não for significativamente maior que o PDQ. Eu recomendaria nada menos do que as estações completas do PDQ2, e mais é melhor. Novamente, ao montar os modelos ARIMA, você deve ter o cuidado de evitar a sobreposição dos dados, apesar do fato de que ele pode ser muito divertido uma vez que você obtém o jeito. Casos especiais importantes: Conforme mencionado acima, um modelo ARIMA (0,1,1) sem constante é idêntico a um modelo de suavização exponencial simples e assume um nível flutuante (ou seja, não há reversão média), mas com tendência zero a longo prazo. Um modelo ARIMA (0,1,1) com constante é um modelo de suavização exponencial simples com um termo de tendência linear diferente de zero. Um modelo ARIMA (0,2,1) ou (0,2,2) sem constante é um modelo de alisamento exponencial linear que permite uma tendência variável no tempo. Um modelo ARIMA (1,1,2) sem constante é um modelo de alisamento exponencial linear com tendência amortecida, ou seja, uma tendência que eventualmente se esmaga em previsões de longo prazo. Os modelos ARIMA sazonais mais comuns são o modelo ARIMA (0,1,1) x (0,1,1) sem constante e o modelo ARIMA (1,0,1) x (0,1,1) com constante. O primeiro desses modelos basicamente aplica o suavização exponencial aos componentes não sazonais e sazonais do padrão nos dados, enquanto permite uma tendência variável no tempo e o último modelo é um pouco semelhante, mas assume uma tendência linear constante e, portanto, um pouco mais longo - previsibilidade do tempo. Você deve sempre incluir esses dois modelos entre a sua formação de suspeitos ao ajustar dados com padrões sazonais consistentes. Um deles (talvez com uma variação menor, como aumento de p ou q em 1 e configuração P1, bem como Q1) é bastante frequente o melhor. (Voltar ao topo da página.)
No comments:
Post a Comment