Em formação

Sobre a possibilidade de modelar a esquizofrenia por modelos de aprendizado de máquina

Sobre a possibilidade de modelar a esquizofrenia por modelos de aprendizado de máquina



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estou trabalhando no uso de um algoritmo de aprendizado de máquina como o aprendizado de decisão de árvore para modelar a função do cérebro humano na esquizofrenia para prever disfunções da parte do cérebro que eu acho que podem ser testadas pela porcentagem de atividade das partes do cérebro em fotos FMRI) para Encontrar modelos matemáticos adequados dessa parte do cérebro por exemplo, eu sugiro:

  • Diferentes algoritmos de árvore de decisão Aprendizado de árvore de decisão (como ID3) para a parte frontal do cérebro por causa de sua função lógica, assumindo que as partes do cérebro funcionam e o algoritmo selecionado corretamente pode ser possível melhorar sua limitação usando alguns algoritmos mais profissionais como C4. 5 algoritmo para cobrir a limitação detectada.

Então, estou pesquisando alguma pesquisa semelhante sobre a modelagem da esquizofrenia por modelos de aprendizado de máquina e encontrei um artigo geral, neste campo:

Combinar modelos psicológicos com aprendizado de máquina para prever melhor as decisões das pessoas

Então, por não encontrar o papel adequado, estou em dúvida se é possível usar modos de aprendizado de máquina para modelar algumas disfunções cerebrais da esquizofrenia.

Se não:

Como estou tentando entender melhor a esquizofrenia, com base no seu conhecimento o quanto essas etapas são práticas para resolver a modelagem matemática da esquizofrenia:

Acho que essas etapas seriam úteis para resolver esse problema:

  1. encontrar funções erradas na parte anterior do cérebro para esquizofrenia com base em FMRI e ...?! (partes difíceis disso)
  2. encontrar um problema mais adequado no aprendizado de máquina dessa parte do cérebro (o que não é tão difícil por causa dos parâmetros caracterizados por algoritmos conhecidos)
  3. Criação de novo método CBT com base no algoritmo de aprendizado de máquina detectado.
  4. Modelagem do método CBT ordinário para algoritmo matemático adequado.
  5. Comparando esses dois métodos de TCC por modelos de computador e, se possível, testes com humanos como tratamento.

Se sim, você poderia sugerir Tags adequadas para este campo de pesquisa e, se possível, encontre algum artigo deste tipo ou artigo de revisão sobre:

modelar algumas disfunções cerebrais da esquizofrenia por meio de modelos de aprendizado de máquina.

Obrigado.


Informação sobre o autor

Afiliações

VA Connecticut Healthcare System, Psychology Service, 116-B, 950 Campbell Ave, West Haven, CT, 06516, EUA

Jason K. Johannesen e Joshua G. Kenney

Psiquiatria, Escola de Medicina da Universidade de Yale, New Haven, CT, EUA

Jason K. Johannesen e Joshua G. Kenney

Ciência da computação e engenharia, University of Connecticut, Storrs, CT, EUA

Ciências Psicológicas, Universidade de Connecticut, Storrs, CT, EUA

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Autor correspondente


Resultados

Resultados de métodos automatizados

A Tabela 1 resume os resultados obtidos por métodos automatizados. Os resultados para detecção de SCZ foram muito maiores do que para ASD, com a diferença de até 20% no caso de precisão. Os melhores resultados para ambos os transtornos em termos de precisão foram obtidos pelo classificador SVM com embeddings USE em um cenário de domínio único. A representação BOW produziu resultados relativamente bons. Deve-se também considerar o desempenho da representação de texto POS + LCM + Sentiment no SCZ um sucesso relativo, especialmente com o XG Boost, pois consiste em apenas 21 recursos. Entre as representações de texto Sentic que funcionam com textos em inglês, os vetores AffectNet com SVM mostraram-se os melhores em termos de precisão para SCZ, e vetores AffectiveSpace com SVM para ASD.

Os resultados dos experimentos de aprendizagem por transferência não são diretos. Ao prever ASD por modelos treinados em SCZ, deve-se observar os altos resultados alcançados pelo USE em um cenário de tiro zero, com muito boa precisão e a melhor especificidade observada. No entanto, isso é válido apenas em uma direção, já que os resultados da previsão de SCZ por modelos treinados em ASD são marginalmente próximos do aleatório.

Os resultados da transferência de aprendizagem no cenário com pré-treinamento ([pré-treinamento] na Tabela 1) revelam que não auxiliam no alcance de resultados de ponta. Um classificador de camada densa sem pré-treinamento consegue alcançar resultados ligeiramente, mas visivelmente melhores, do que a variante com pré-treinamento.

No entanto, isso não significa que não haja informações valiosas que alguém possa usar, e parece haver algumas informações relevantes de previsão de ASD nos dados de SCZ. Isso pode ser confirmado não apenas pelo sucesso relativo da abordagem de tiro zero. Na configuração de pré-treinamento ([pré-treinamento]), o treinamento no domínio de origem foi realizado, desde que melhorasse a perda no conjunto de dev que consiste apenas em dados do domínio de destino. Na maioria dos casos, o treinamento continuou por 3 a 6 épocas, em média. Como o treinamento não parou após uma época, isso indica que as primeiras épocas de treinamento melhoraram a perda de dados não apenas de um, mas de ambos os domínios.

Resultados de métodos humanos e automatizados

A Figura 1 ilustra os resultados de humanos e as melhores abordagens baseadas em computador para a detecção de ASD e SCZ.

Precisão de métodos baseados em computador selecionados e linhas de base humanas

Os melhores métodos baseados em computador superam as melhores linhas de base humanas: Avaliadores 1 e 2 diagnosticando SCZ e Avaliadores 3 e 4 diagnosticando ASD. Esta observação é mais significativa no caso de SCZ, mas também é válida para ASD. A aprendizagem de transferência no cenário de tiro zero produz bons resultados de SCZ para ASD, mas não ao contrário (aqui, os resultados aproximam-se da linha de base aleatória de 0,5). Os melhores desempenhos são os embeddings USE com classificador SVM.

Aprendizagem Few-Shot

Métodos de aprendizado profundo geralmente dependem de conjuntos de dados em grande escala com pelo menos milhares de exemplos rotulados. Uma abordagem de aprendizagem de poucas tentativas é proposta para lidar com o problema de pequenas quantidades de dados de treinamento e aprender de forma eficiente com alguns exemplos.

Modificamos o código em um dos repositórios disponíveis publicamente, nota de rodapé 2, e o adaptamos para uso com dados de texto. Em vez de codificadores convolucionais, introduzimos camadas densas, agindo em USE embeddings como entrada em vez de pixels de imagem.

Das várias soluções testadas, a que apresentou os melhores resultados foi a Rede Prototípica [54]. Ele é baseado na suposição de que existe um embedding que os pontos se agrupam, chamado de protótipo. O algoritmo aprende um espaço métrico no qual a classificação pode ser realizada calculando distâncias para as representações de protótipo de cada classe. Depois de amostrar o suporte e os exemplos de consulta, os protótipos são calculados como a média dos embeddings para o conjunto de suporte (amostras rotuladas). A probabilidade de um ponto de consulta pertencer a uma determinada classe é igual ao softmax nas distâncias até os protótipos. Definimos o número de épocas como 30, o tamanho do conjunto de dados da consulta como o parâmetro qt. A configuração é bidirecional (k-way), com um n-parâmetro (n-shot) determinado pelo nt como na Tabela 2, que apresenta os resultados da abordagem de Redes Prototípicas em ambos os conjuntos de dados, em média de 5 experimentos. A tabela também inclui uma configuração de linha de base: resultados médios de um experimento repetido 10 vezes com treinamento de rede neural padrão, com base na representação USE e o classificador denso descrito no início da Seção 2. O tamanho dos conjuntos de treinamento selecionados aleatoriamente não era casos, e os conjuntos de teste consistiam em 20 observações aleatórias. O número de épocas foi definido como 10.

Os resultados indicam que o único conjunto de dados onde o método de aprendizagem de poucas tentativas é aplicável vem de pacientes com SCZ. No caso do ASD, os valores não excedem as linhas de base aleatórias. No caso do SCZ, há uma relação clara entre o aumento da precisão e o número de observações de treinamento. Muito possivelmente, os melhores valores poderiam ser alcançados por conjuntos de treinamento ainda maiores do que os testados. Também está claro que a solução de poucas tentativas de redes prototípicas tem uma vantagem sobre a linha de base do treinamento de rede neural típico.


Os conjuntos de dados gerados para este artigo não estão prontamente disponíveis porque os dados brutos não podem ser tornados públicos; se necessário, dados de recursos podem ser fornecidos. As solicitações de acesso aos conjuntos de dados devem ser direcionadas para liuxiaoqian & # x00040psych.ac.cn.

Os estudos envolvendo participantes humanos foram revisados ​​e aprovados pelo comitê de ética em pesquisa científica do Instituto de Psicologia da Academia Chinesa de Ciências (H15010). Os pacientes / participantes forneceram consentimento informado por escrito para participar deste estudo. O consentimento informado por escrito foi obtido do (s) indivíduo (s) para a publicação de quaisquer imagens ou dados potencialmente identificáveis ​​incluídos neste artigo.


Afiliações

Cognitive Systems, Faculty of Arts, University of British Columbia, Vancouver, BC, Canadá

Neuroética do Canadá, Divisão de Neurologia, Departamento de Medicina, Universidade de British Columbia, Vancouver, BC, Canadá

Jacob McFarlane e Judy Illes

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Contribuições

J.M. gerou o conteúdo do artigo, escreveu o primeiro rascunho e trabalhou em estreita colaboração com o supervisor Dr. Illes, que supervisionou todos os aspectos deste trabalho até o produto final.

Autor correspondente


Aprendizado de máquina e big data: implicações para a modelagem de doenças e descoberta terapêutica em psiquiatria

A capacidade de aprendizado de máquina é uma promessa para informar os modelos de doenças, a descoberta e o desenvolvimento de novas terapias modificadoras de doenças e estratégias de prevenção em psiquiatria. Aqui, fornecemos uma introdução sobre como o aprendizado de máquina / Inteligência Artificial (IA) pode instanciar esses recursos, bem como fornecer uma justificativa para sua aplicação à psiquiatria em ecossistemas clínicos e de pesquisa.

Métodos

Os bancos de dados PubMed e PsycINFO foram pesquisados ​​de 1966 a junho de 2016 para as palavras-chave:Big Data, Aprendizado de Máquina, Medicina de Precisão, Inteligência Artificial, Saúde Mental, Doença Mental, Psiquiatria, Mineração de Dados, RDoC e Critérios de Domínio de Pesquisa. Os artigos selecionados para revisão foram aqueles que foram considerados alinhados com o objetivo deste artigo específico.

Resultados

Os resultados indicam que a IA é uma opção viável para construir preditores úteis de resultados, ao mesmo tempo que oferece métricas de precisão objetivas e comparáveis, uma oportunidade única, particularmente na pesquisa em saúde mental. A abordagem também trouxe, de forma consistente, uma visão notável dos modelos de doenças por meio do processamento da vasta quantidade de dados médicos semiestruturados de vários domínios já disponíveis. A oportunidade para IA em psiquiatria, além do refinamento do modelo da doença, está na caracterização daqueles em risco e provavelmente também é relevante para personalizar e descobrir a terapêutica.


Prevendo resistência ao tratamento em pacientes com esquizofrenia

A esquizofrenia é uma condição de saúde mental grave de longo prazo que causa sintomas psicóticos durante os quais a pessoa pode não ser capaz de distinguir seus próprios pensamentos e ideias da realidade: pessoas com esquizofrenia tendem a ter percepções sensoriais que não são baseadas em estímulos externos (alucinações) , sentimentos persistentes de estar sob ameaça (paranóia) e crenças anormais, que levam à solidão, ao isolamento e à incapacidade de manter suas vidas como estavam antes da doença ocorrer. A taxa de mortalidade por suicídio é de 4 a 13 vezes maior em pessoas com esquizofrenia do que na população em geral, e sua expectativa de vida é 20 anos menor.

Os tratamentos antipsicóticos atualmente disponíveis visam aliviar esses sintomas psicóticos, mas aproximadamente um terço dos pacientes com esquizofrenia não responde a esses medicamentos. Este grupo de pacientes é conhecido por ter esquizofrenia resistente ao tratamento (TRS). Pacientes com SRT apresentam maiores taxas de desemprego, pior qualidade de vida e pior funcionamento social e ocupacional do que aqueles que respondem ao tratamento. Portanto, há uma necessidade de melhorar os resultados desses pacientes.

Aproximadamente um terço dos pacientes com esquizofrenia são resistentes ao tratamento.

Esquizofrenia resistente ao tratamento (TRS): o que é e como é tratada
A esquizofrenia resistente ao tratamento (TRS) é geralmente definida como uma resposta insuficiente a pelo menos dois estudos sequenciais com diferentes medicamentos antipsicóticos de doses adequadas tomadas durante um período de tempo adequado. A clozapina é o único antipsicótico conhecido que é eficaz em pessoas com TRS. No entanto, devido aos seus efeitos adversos, a clozapina é recomendada como tratamento de terceira linha, o que significa que é usada apenas quando dois outros tratamentos antipsicóticos se mostraram ineficazes.

Infelizmente, o TRS muitas vezes não é detectado, o que resulta no início da clozapina após um atraso de alguns anos, ou mesmo na ausência de início. Na verdade, embora as diretrizes de tratamento indiquem que os pacientes podem ser diagnosticados com TRS e prescrita clozapina logo 12 semanas após o início do tratamento antipsicótico, o atraso médio é de 3,9 anos - anos durante os quais os pacientes são tratados de forma inadequada, consequentemente expondo-os e seus entes queridos outros a um longo período de sofrimento desnecessário. Na verdade, a Dra. Ajnakina e sua equipe observaram que, durante um período de cinco anos, apenas metade dos pacientes com TRS começaram o tratamento com clozapina. A outra metade não o iniciou, apesar de atender aos critérios para este tratamento. Encurtar o período de tratamento inadequado antes do início do tratamento com clozapina seria benéfico para os pacientes e seus entes queridos, especialmente porque um atraso mais curto está associado a uma melhor resposta à clozapina e, subsequentemente, à melhoria da qualidade de vida. Uma maneira de fazer isso é identificar os pacientes com probabilidade de desenvolver TRS mais cedo do que no curso de sua doença e acelerar seu acesso ao tratamento com clozapina.

Um benefício crucial dos modelos de previsão é sua capacidade de informar os indivíduos sobre o risco de uma doença.

A esquizofrenia resistente ao tratamento não é uma entidade única
TRS é um fenômeno complexo que décadas de pesquisadores lançaram apenas uma luz limitada sobre nossa compreensão de por que ele se desenvolve. O progresso limitado na pesquisa do TRS feito pode ser devido ao fato de que o TRS estava sendo investigado como uma entidade única, o que pode não ser totalmente preciso. Na verdade, a Dra. Ajnakina e sua equipe estavam entre os primeiros pesquisadores a demonstrar que a esquizofrenia resistente ao tratamento pode ter diferentes subtipos com diferentes causas subjacentes. Especificamente, eles mostraram que cerca de 70% dos pacientes com TRS não responderam aos medicamentos antipsicóticos desde o primeiro tratamento para seus sintomas (isto é, esquizofrenia resistente ao tratamento precoce (E-TR)), enquanto os 30% restantes dos pacientes com TRS, em geral definida como esquizofrenia resistente ao tratamento tardio (L-TR), transição gradual para resistência ao tratamento tendo inicialmente respondido a medicamentos antipsicóticos. Essas descobertas foram inovadoras, pois foram as primeiras a mostrar que, entre os pacientes com esquizofrenia que serão resistentes ao tratamento, uma grande proporção não responderá a nenhum tratamento com medicamentos antipsicóticos não clozapínicos desde o início do tratamento. Pacientes resistentes ao tratamento precoce (E-TR) irão inicialmente responder favoravelmente aos medicamentos antipsicóticos não clozapina, mas gradualmente farão a transição para a resistência ao tratamento, este grupo é conhecido como resistente ao tratamento tardio (L-TR). A alta proporção de pacientes que apresentam E-TR destaca a importância de reduzir o atraso no uso da clozapina, pois todos esses pacientes são tratados inadequadamente por muito tempo. Nesse ínterim, a existência de L-TR complica ainda mais a detecção de TRS, pois os pacientes que respondem ao tratamento podem parar de responder.

Preditores: o que são?
A identificação de fatores de risco relacionados ao cumprimento de critérios para subtipos de TRS permite uma avaliação rápida de um risco individual para subtipos de TRS, que está no centro de uma avaliação de risco mais aprofundada, monitoramento de acompanhamento e estratégias de prevenção individualizadas. Os preditores de TRS são fatores de risco que indicam que um paciente com esquizofrenia tem maior risco de ser resistente ao tratamento. A identificação de tais preditores seria útil para identificar pacientes com TRS mais cedo durante o tratamento, para que eles possam receber a prescrição de clozapina mais cedo. Além disso, os preditores também ajudariam os cientistas a entender as causas do TRS. Diferentes equipes de pesquisadores, incluindo a equipe do Dr. Ajnakina, tentaram identificar preditores de TRS e seus subtipos.

Por exemplo, em um estudo longitudinal, a Dra. Ajnakina e sua equipe relataram que os pacientes tratados com clozapina eram aqueles que, no momento do primeiro contato com os serviços de saúde para esquizofrenia, apresentavam a psicopatologia mais grave. Esse achado indica que um clínico pode estar mais propenso a prescrever clozapina quando a apresentação sintomática da doença é mais grave. Outra diferença observada entre os pacientes com TRS que iniciaram o tratamento com clozapina e aqueles que não o fizeram foi que os pacientes tratados com clozapina eram mais propensos a viver com parentes ou amigos, sugerindo que o início do tratamento com clozapina pode depender do apoio da família e arranjos de vida estáveis . Relatórios de outras equipes indicam que vários fatores como sexo masculino, nascimento no outono ou inverno, funcionamento pré-mórbido pobre e educação rural também podem contribuir para a resistência ao tratamento, embora mais dados sejam necessários para confirmar o papel desses fatores como preditores de TRS .

Para aqueles que desenvolveram uma doença, os modelos de previsão podem estimar a trajetória mais provável da doença.

Modelos de previsão e por que eles são importantes
Um benefício crucial dos modelos de previsão é sua capacidade de informar os indivíduos sobre o risco de uma doença. Para aqueles que desenvolveram uma doença, os modelos de previsão podem instruir sobre a trajetória mais provável da doença. Modelos de previsão confiáveis ​​podem, portanto, orientar as decisões dos médicos para implementar intervenções preventivas ou estratégias de medicina personalizada, para melhorar os resultados dos pacientes.

Para estimar ainda mais precisamente o risco de um paciente desenvolver resistência ao tratamento, é imperativo empregar algoritmos de aprendizagem estatísticos que são reconhecidos como ideais para a previsão de risco personalizada. Isso ocorre porque eles permitirão o desenvolvimento de modelos de predição precisos para estimar o risco individual, em vez da média, de um resultado do transtorno durante a doença, com base nas características do paciente e nos achados clínicos disponíveis. Esses métodos conseguem isso, em vez de olhar para preditores individuais um de cada vez, o que aumenta significativamente o risco de produzir resultados irrealizáveis, levando em consideração todos os preditores ao mesmo tempo em que ajusta para quaisquer vieses que possam estar presentes, como correlacionados entre as variáveis e testes múltiplos.

Tero Vesalainen / Shutterstock.com

Prevendo resistência ao tratamento
Apesar do vasto impacto pessoal e social da esquizofrenia, faltavam medidas preventivas para pessoas em risco de desenvolver a doença e opções de tratamento curativo personalizado para pessoas que desenvolveram a doença. Portanto, a Dra. Ajnakina e sua equipe estão desenvolvendo modelos de previsão confiáveis ​​para estimar um risco individual para E-TR e L-TR, com o objetivo de compreender o risco dos pacientes de desenvolver resistência ao tratamento, especialmente após um período de resposta favorável ao tratamento em curso com medicamentos antipsicóticos.

Tendo se concentrado em fatores conhecidos por estarem associados a resultados ruins de esquizofrenia, como experiências adversas na infância, uso de substâncias e falta de apoio social, eles empregaram métodos de aprendizagem estatística intensiva por computador, particularmente métodos de regressão regularizados, sugeridos como métodos ideais para uso clínico e personalizado previsão de risco.

Os modelos desenvolvidos tiveram boa capacidade discriminativa para identificar aqueles pacientes com esquizofrenia que estavam em um risco maior vs menor para atender aos critérios para E-TR e L-TR. A capacidade discriminativa obtida para cada modelo estava no mesmo nível dos modelos de previsão para doença cardíaca coronária, câncer de mama e doença cardiovascular, que agora estão incluídos nas diretrizes clínicas para gerenciamento terapêutico. Além disso, os modelos de predição desenvolvidos para estimar um risco individual de desenvolver E-TR e L-TR após o início da esquizofrenia mostraram uma forte capacidade de identificar aqueles pacientes com esquizofrenia que não desenvolverão esses subtipos de TRS nos 5 anos seguintes, enquanto a alta especificidade implica que esses modelos provavelmente classificam corretamente uma proporção maior de pacientes com esquizofrenia como de alto risco para subtipos de TRS nos 5 anos seguintes. Assim, a utilização desses modelos na prática pode reduzir as chances de pacientes com esquizofrenia recém-diagnosticados serem expostos a planos de intervenção inadequados projetados para esquizofrenia resistente ao tratamento.

Embora seja necessário mais trabalho para melhorá-los, esses modelos de previsão permitem uma avaliação rápida de um risco individual para subtipos de TRS, o que pode ser útil para implementar estratégias de prevenção individualizadas.

Resposta pessoal

Qual foi o desafio que você enfrentou ao conduzir esta pesquisa e como você o superou?

Quando pesquisadores e médicos falam sobre resistência ao tratamento na esquizofrenia, eles frequentemente, involuntariamente ou não, criam um quadro de desgraça inevitável para os pacientes afetados e seus entes queridos. Este não é o caso! A parte desafiadora deste trabalho foi fornecer um equilíbrio entre a gravidade da doença e a esperança de melhores resultados para as pessoas afetadas. Chegamos a uma era em que, com as ferramentas certas, podemos criar ferramentas de previsão de risco personalizadas para a esquizofrenia que levariam a melhores estratégias de intervenção e prevenção. Lidei com esse desafio revisando criticamente as evidências atuais e incluí uma palavra de cautela para o otimismo excessivo. Sim, nosso trabalho ainda precisa ser aprimorado usando uma amostra maior, mas o primeiro passo é o mais difícil, e certamente o fizemos neste trabalho.


Discussão

Até onde sabemos, este é o primeiro estudo até o momento a explorar um método de aprendizado de máquina de ensemble ensemble com o algoritmo de seleção de recursos M5 Prime usando biomarcadores moleculares para a construção de algoritmos preditivos de resultados funcionais em esquizofrenia entre pacientes taiwaneses. Além disso, conduzimos o primeiro estudo para pesquisar prováveis ​​biomarcadores para resultados funcionais de esquizofrenia usando biomarcadores genéticos. Os resultados indicaram que o método de aprendizado de máquina de ensemble ensemble com seleção de recursos usando dois biomarcadores genéticos (G72 rs2391191 e CONHECEU rs2237717 SNPs) ultrapassou outros modelos preditivos de última geração em termos de RMSE para prever o resultado de QLS. Além disso, para prever o resultado do GAF, observamos que o método de aprendizado de máquina de ensemble ensemble com seleção de características usando um biomarcador genético (AKT1 rs1130233) ultrapassou outros algoritmos preditivos de última geração em termos de RMSE.

Tirando vantagem dos biomarcadores genéticos, criamos os algoritmos preditivos de resultados funcionais em pacientes com esquizofrenia usando o método de aprendizado de máquina de ensemble ensemble com o algoritmo de seleção de recursos M5 Prime. Este estudo é uma prova de conceito de uma estrutura preditiva de aprendizado de máquina para prever resultados funcionais da esquizofrenia. Os resultados sugerem que o método de aprendizado de máquina com ensemble ensemble pode fornecer uma ferramenta clinicamente viável para prever os resultados funcionais da esquizofrenia.

Além disso, vale a pena discutir o algoritmo de seleção de recursos M5 Prime para descobrir prováveis ​​biomarcadores neste estudo. Descobrimos que o método de aprendizado de máquina de ensemble ensemble com os biomarcadores selecionados do algoritmo de seleção de recursos M5 Prime ultrapassou consistentemente o método de aprendizado de máquina de ensemble ensemble sem usar a seleção de recursos. Por exemplo, o método de aprendizado de máquina de ensemble ensemble com o conjunto de dados Feature-B superou o método de aprendizado de máquina de ensemble ensemble com o Feature-A na previsão do resultado QLS. Da mesma forma, o modelo de ensemble ensemble com o conjunto de dados Feature-C ultrapassou o método de aprendizado de máquina de ensemble ensemble com o conjunto de dados Feature-A na previsão do resultado GAF. Em outras palavras, o método de aprendizado de máquina com ensemble ensemble com seleção de recursos inclinado a obter valores RMSE mais baixos (quanto melhor o desempenho). Os resultados sugerem que o algoritmo de seleção de recursos M5 Prime pode ter um melhor potencial para isolar biomarcadores que afetam os resultados funcionais da esquizofrenia. Em conformidade, tem sido relatado que os métodos de aprendizagem de máquina com seleção de recursos superaram aqueles sem seleção de recursos na previsão do diagnóstico e resultado do tratamento de transtornos psiquiátricos 10,22,23.

Notavelmente, especulamos ainda os efeitos sinérgicos de biomarcadores escolhidos (nomeadamente o conjunto de dados Feature-B), que foram identificados pelo algoritmo de seleção de recursos M5 Prime quando um conjunto de dados de biomarcadores de 11 variantes genéticas foi utilizado para prever o resultado QLS. Conforme indicado na seção "Resultados", o conjunto de dados do Recurso B compreendia 2 SNPs (a saber G72 rs2391191 e CONHECEU rs2237717) para o resultado QLS. Posteriormente, o método de aprendizado de máquina de ensemble ensemble com seleção de recursos usando o conjunto de dados Feature-B teve melhor desempenho na previsão do resultado QLS entre os algoritmos preditivos. Até onde sabemos, poucos estudos foram investigados para avaliar as ligações causais entre as variantes genéticas. Os mecanismos biológicos dessas ligações causais nos resultados funcionais da esquizofrenia ainda precisam ser elucidados. Foi demonstrado que CONHECEU rs2237717 foi associado à esquizofrenia 19 e G72 rs2391191 também foi associado à esquizofrenia 8. Com base nas descobertas anteriores 8,19, é hipotetizado que as interações sinérgicas entre variantes genéticas podem fornecer uma marca dos efeitos moleculares sobre os resultados funcionais da esquizofrenia.

Em conclusão, construímos um método de aprendizado de máquina com ensemble ensemble com seleção de recursos para prever resultados funcionais de esquizofrenia em pacientes taiwaneses usando biomarcadores genéticos. A análise revela que o método de aprendizado de máquina com ensemble ensemble com seleção de recursos pode apresentar uma ferramenta plausível para construir modelos preditivos para resultados funcionais de esquizofrenia em termos de desempenho favorável. No entanto, é fundamental investigar mais a fundo o papel do método de aprendizado de máquina de ensemble ensemble por meio de mais estudos de replicação. Em última análise, esperaríamos que os achados do presente estudo pudessem ser generalizados na psiquiatria de precisão para predizer o diagnóstico e os resultados do tratamento para vários transtornos psiquiátricos. Além disso, as descobertas podem ser provavelmente aproveitadas para desenvolver ferramentas de diagnóstico e prognóstico moleculares em um futuro próximo.


Materiais e métodos

Este estudo foi aprovado pelo conselho de revisão institucional do China Medical University Hospital em Taiwan e foi conduzido de acordo com a Declaração de Helsinque.

População de estudo

A coorte do estudo consistiu de 302 pacientes com esquizofrenia, que foram recrutados no China Medical University Hospital e afiliado ao Taichung Chin-Ho Hospital em Taiwan 5. Neste estudo, os pacientes com esquizofrenia tinham 18 & # x0201365 & # x000a0anos e eram saudáveis ​​nas condições físicas. Depois de apresentar uma descrição completa deste estudo aos sujeitos, obtivemos consentimento informado por escrito de um dos pais e / ou responsável legal, de acordo com as diretrizes do conselho de revisão institucional. Detalhes do diagnóstico de esquizofrenia foram publicados anteriormente 5.

Escalas de sintomas clínicos

Neste estudo, empregamos 3 escalas de sintomas clínicos para avaliar sintomas positivos, negativos e depressivos 5, incluindo a subescala PANSS-Positiva 34, SANS20 35 e HAMD17 36.

Pontuação de função cognitiva

Empregamos 11 escores de função cognitiva para avaliar as funções cognitivas 5, incluindo fluência de categoria, trail making A, codificação de símbolos de dígitos (Wechsler Adult Intelligence Scale, terceira edição (WAIS-III)), d-Prime da versão clara, d-Prime de versão borrada, memória de trabalho verbal, memória de trabalho não verbal, aprendizagem e memória verbal, aprendizagem e memória visual, raciocínio e resolução de problemas e cognição social. Em resumo, esses 11 escores de função cognitiva foram usados ​​para avaliar 7 domínios cognitivos, como velocidade de processamento, atenção sustentada, memória de trabalho, aprendizagem verbal e memória, aprendizagem visual e memória, raciocínio e resolução de problemas e cognição social 5. A velocidade do domínio de processamento foi avaliada usando fluência de categoria, criação de trilha A e codificação de símbolos de dígitos WAIS-III. O domínio de atenção sustentada foi avaliado usando d-Prime da versão clara e d-Prime da versão borrada. O domínio da memória operacional foi avaliado por meio da memória operacional verbal e da memória operacional não verbal.

Resultados funcionais

Medimos os resultados funcionais usando o QLS 1 e a escala GAF do DSM-IV 2. QLS é uma ferramenta para fornecer a classificação de resultados funcionais na esquizofrenia, incluindo atividade social, iniciativas sociais, isolamento social, senso de propósito, motivação, curiosidade, anedonia, inatividade sem objetivo, capacidade de empatia, interação emocional 8. GAF é uma ferramenta que fornece uma medida para avaliar o funcionamento psicológico, social e ocupacional global na esquizofrenia 2.

Análise estatística

O teste t de Student & # x02019s foi realizado para medir a diferença nas médias de duas variáveis ​​contínuas 37. Foi realizado o teste do qui-quadrado para dados categóricos. O critério de significância foi estabelecido em P& # x02009 & # x0003c & # x020090.05 para todos os testes. Os dados são apresentados como a média & # x02009 & # x000b1 & # x02009 desvio padrão.

Com a suposição de que um nível de confiança de 95% e uma proporção de 0,5, uma fórmula simplificada 38 foi usada para calcular os tamanhos de amostra da seguinte forma: n& # x02009 = & # x02009N / (1 & # x02009 + & # x02009N (e) 2), onde n é o tamanho da amostra, N é o tamanho da população, e e é o nível de precisão. Neste estudo, presumimos que N& # x02009 = & # x02009230.000 e e& # x02009 = & # x020090.06.

Modelos preditivos de ensemble ensemble

Empregamos uma técnica de aprendizado de máquina de conjunto chave chamada preditores de bagging 25 e utilizamos o software Waikato Environment for Knowledge Analysis (WEKA) (que está disponível em https://www.cs.waikato.ac.nz/ml/weka/) 26 para realizar a estrutura preditiva do ensemble ensemble. Além disso, outras ferramentas de software de aprendizado de máquina podem ser empregadas, por exemplo, Pattern Recognition for Neuroimaging Toolbox (PRoNTo http://www.mlnl.cs.ucl.ac.uk/pronto/) e NeuroMiner (https: // github. com / neurominer-git). Todos os experimentos foram conduzidos em um computador com Intel (R) Core (TM) i5-4210U, 4 & # x000a0GB RAM e Windows 7 21. Deve-se notar que utilizamos o método de validação cruzada repetida em dez vezes para examinar a generalização dos preditores de bagging 21, 32, 39.

A Figura & # x000a0 1 mostra o diagrama ilustrativo da estrutura preditiva de ensemble ensemble com seleção de recursos. A técnica do algoritmo preditivo de ensemble de bagging é usada para combinar o desempenho preditivo de várias versões de um preditor de base para atingir um preditor agregado com maior precisão. As múltiplas versões do preditor de base são formadas pelo método bootstrap, onde o método bootstrap é um dos métodos de reamostragem de dados mais populares usados ​​em análises estatísticas. A técnica do algoritmo preditivo ensemble bagging tende a reduzir a variância e evitar overfitting. O preditor básico que empregamos foi MFNNs ou SVM. Aqui, usamos os parâmetros padrão do WEKA, como 100 para o tamanho do lote, 100 para a porcentagem do tamanho da sacola e 10 para o número de iterações 21, 40.

A ilustração esquemática do algoritmo preditivo de conjunto de ensacamento com seleção de recursos. Primeiro, o algoritmo de seleção de recursos M5 Prime é executado para selecionar um subconjunto de recursos, que serve como entrada para o algoritmo preditivo de conjunto de ensacamento. A ideia do algoritmo preditivo de ensemble bagging é gerar as várias versões de um preditor de base por replicações de bootstrap. A previsão final é então produzida pela média do desempenho preditivo das várias versões. O preditor de base foi escolhido como redes neurais multicamadas feedforward (MFNNs) ou máquina de vetor de suporte (SVM) neste estudo. GAF & # x02009 = & # x02009 Avaliação global do funcionamento QLS & # x02009 = & # x02009 Escala de qualidade de vida.

Algoritmos de aprendizado de máquina para benchmarking

Para a tarefa de benchmarking no presente estudo, utilizamos 4 algoritmos de aprendizado de máquina de última geração, incluindo MFNNs, SVM, regressão linear e florestas aleatórias. Realizamos as análises para esses 4 algoritmos de aprendizado de máquina usando o software WEKA 26 e um computador com Intel (R) Core (TM) i5-4210U, 4 & # x000a0GB RAM e Windows 7 21. Outras ferramentas de software de aprendizado de máquina, como PRoNTo (http://www.mlnl.cs.ucl.ac.uk/pronto/) e NeuroMiner (https://github.com/neurominer-git) também podem ser usadas. Deve-se notar que utilizamos o método de validação cruzada de dez vezes repetido para examinar a generalização desses 4 algoritmos de aprendizado de máquina 21, 32, 39.

Uma estrutura MFNN consiste em uma camada de entrada, uma ou várias camadas ocultas e uma camada de saída, onde cada camada contém estruturas de neurônios e as conexões entre as estruturas de neurônios não contêm ciclos direcionados 21, 41. Em geral, o algoritmo de retropropagação 42 é amplamente aproveitado para treinar a estrutura MFNN, em que o algoritmo de retropropagação atualiza os pesos das estruturas de neurônios nas camadas da estrutura MFNN 21, 43. Neste estudo, usamos a arquitetura contendo 1 camada oculta. Por exemplo, usamos os seguintes parâmetros WEKA & # x02019s para treinar o modelo MFNN com 1 camada oculta: o momento & # x02009 = & # x020090.01, a taxa de aprendizagem & # x02009 = & # x020090.01 e o tamanho do lote & # x02009 = & # x02009100 21, 40.

O algoritmo SVM 44 é uma técnica popular para reconhecimento e classificação de padrões 21. O algoritmo SVM, que é baseado na teoria de aprendizagem estatística, encontra uma relação linear entre as variáveis ​​de entrada e a variável dependente (ou seja, a saída prevista) 44, 45. O melhor modelo para a saída prevista é obtido minimizando os coeficientes da função de custo e os erros preditivos, onde a função de custo consiste nos coeficientes de regressão e um termo de erro 44, 45. Neste estudo, usamos o kernel polinomial com o valor expoente de 1,0 24.

O modelo de florestas aleatórias combina uma coleção de árvores de decisão, onde uma árvore de decisão é definida como uma árvore invertida com três tipos de nós, como um nó raiz, nós internos e nós folha 21, 46. O modelo de florestas aleatórias é conceituado para obter uma melhor previsão agregando os resultados preditivos de uma coleção de árvores de decisão 21, 46. Aqui, usamos os parâmetros padrão do WEKA para o modelo de florestas aleatórias, por exemplo, 100 para o tamanho do lote e 100 para o número de iterações 21.

O modelo de regressão linear, o método padrão para problemas de predição em aplicações clínicas, foi usado como base de comparação 21, 26. A regressão linear é adequada para avaliar a relação entre uma resposta escalar (isto é, uma variável dependente) e variáveis ​​explicativas (isto é, variáveis ​​independentes) ajustando uma equação linear aos dados 21, 26.

Algoritmo de seleção de recursos M5 Prime

No presente estudo, utilizamos uma abordagem baseada no critério de informação de Akaike (AIC) chamada de algoritmo M5 Prime 26 para a tarefa de seleção de recursos. O algoritmo M5 Prime constrói uma árvore de decisão com modelos lineares multivariados nos nós terminais e remove iterativamente o recurso com o menor coeficiente padronizado até que nenhuma melhoria adicional no erro estimado definido pelo AIC 47, 48. Além disso, utilizamos o método de validação cruzada de dez vezes para examinar a generalização da tarefa de seleção de recursos 21, 32, 39.

Para prever o QLS e o GAF, usamos o algoritmo M5 Prime para selecionar recursos de 2 conjuntos de dados de recursos diferentes (Fig. & # X000a0 1). O primeiro conjunto de dados de recursos inclui 3 escalas de sintomas clínicos. O segundo conjunto de dados de recursos inclui 11 pontuações de função cognitiva.

Avaliação do desempenho preditivo

Neste estudo, utilizamos um dos critérios mais populares, o RMSE, para avaliar o desempenho de modelos preditivos 32, 45, 49. O RMSE calcula a diferença entre os valores medidos e os valores estimados por um modelo preditivo. Quanto melhor for o modelo de previsão, menor será o RMSE 32, 49. Além disso, utilizamos o método de validação cruzada de dez vezes repetido para examinar a generalização de modelos preditivos 21, 32, 39. Primeiro, todo o conjunto de dados foi dividido aleatoriamente em dez segmentos separados. Em segundo lugar, o modelo preditivo foi treinado usando nove décimos dos dados e foi testado usando o décimo restante dos dados para avaliar o desempenho preditivo. Em seguida, a etapa anterior foi repetida mais nove vezes, deixando de fora nove décimos dos dados como dados de treinamento e um décimo distinto dos dados como dados de teste. Finalmente, a estimativa média foi relatada em todas as execuções, processando a validação cruzada de dez vezes acima mencionada por 10 vezes com lotes de dados distintos. Estimamos o desempenho de todos os modelos preditivos usando o método de validação cruzada repetida de dez vezes.


Modulação da dopamina para aprendizagem adaptativa: um modelo neurocomputacional

Tem havido muitas propostas de que as taxas de aprendizagem no cérebro são adaptativas, no sentido de que aumentam ou diminuem dependendo das condições ambientais. A maioria desses modelos são abstratos e não fazem nenhuma tentativa de descrever os circuitos neurais que implementam os cálculos propostos. Este artigo descreve um modelo computacional biologicamente detalhado que supera essa deficiência.Especificamente, propomos um circuito neural que implementa taxas de aprendizado adaptativo modulando o ganho na resposta da dopamina aos erros de previsão de recompensa, e modelamos a atividade dentro desse circuito no nível de neurônios de spiking. O modelo gera um sinal de dopamina que depende do tamanho da população de neurônios dopaminérgicos tonicamente ativos e da taxa de pico fásico. O modelo foi testado com sucesso contra os resultados de dois estudos de registro de neurônio único e um estudo de voltametria cíclica de varredura rápida. Concluímos discutindo a aplicabilidade geral do modelo para tarefas mediadas por dopamina que transcendem os fenômenos experimentais que foi inicialmente projetado para abordar.

Esta é uma prévia do conteúdo da assinatura, acesso através de sua instituição.


Sobre a possibilidade de modelagem da esquizofrenia por modelos de aprendizado de máquina - Psicologia

"A tecnologia de aprendizado de máquina está avançando tão rapidamente que nos dá ferramentas para minerar dados da mente humana", diz o psicólogo Emory Phillip Wolff, autor sênior do estudo.

Um método de aprendizado de máquina descobriu uma pista oculta na linguagem das pessoas, preditiva do surgimento posterior da psicose & # 8212, o uso frequente de palavras associadas ao som. O jornal npj Schizophrenia publicou as descobertas de cientistas da Emory University e da Harvard University.

Os pesquisadores também desenvolveram um novo método de aprendizado de máquina para quantificar com mais precisão a riqueza semântica da linguagem conversacional das pessoas, um indicador conhecido de psicose.

Seus resultados mostram que a análise automatizada das duas variáveis ​​de linguagem & # 8212 uso mais frequente de palavras associadas a som e fala com baixa densidade semântica ou imprecisão & # 8212 pode prever se uma pessoa em risco desenvolverá psicose posteriormente com 93 por cento de precisão .

Mesmo os clínicos treinados não perceberam como as pessoas em risco de psicose usam mais palavras associadas a sons do que a média, embora a percepção auditiva anormal seja um sintoma pré-clínico.

& # 8220Tentar ouvir essas sutilezas em conversas com as pessoas é como tentar ver germes microscópicos com os olhos & # 8221 diz Neguine Rezaii, primeira autora do artigo. & # 8220A técnica automatizada que desenvolvemos é uma ferramenta realmente sensível para detectar esses padrões ocultos. É como um microscópio para detectar sinais de psicose. & # 8221

Rezaii começou a trabalhar no papel enquanto era residente na Emory School of Medicine & # 8217s Departamento de Psiquiatria e Ciências do Comportamento. Ela agora é bolsista da Harvard Medical School & # 8217s Department of Neurology.

& # 8220Sabia-se anteriormente que as características sutis da psicose futura estão presentes na linguagem das pessoas & # 8217s, mas nós usamos o aprendizado de máquina para realmente descobrir detalhes ocultos sobre essas características, & # 8221 diz o autor sênior Phillip Wolff, professor de psicologia na Emory. O laboratório de Wolff & # 8217s se concentra na semântica da linguagem e no aprendizado de máquina para prever a tomada de decisões e a saúde mental.

& # 8220Nossa descoberta é nova e adiciona à evidência que mostra o potencial do uso de aprendizado de máquina para identificar anormalidades linguísticas associadas a doenças mentais, & # 8221 diz a coautora Elaine Walker, professora de psicologia e neurociência da Emory que pesquisa como a esquizofrenia e outras desenvolvem-se transtornos psicóticos.

O início da esquizofrenia e de outros transtornos psicóticos geralmente ocorre no início dos anos 20, com sinais de alerta & # 8212 conhecido como síndrome prodrômica & # 8212 começando por volta dos 17 anos. Cerca de 25 a 30 por cento dos jovens que preenchem os critérios para uma síndrome prodrômica desenvolverão esquizofrenia ou outro transtorno psicótico.

Usando entrevistas estruturadas e testes cognitivos, médicos treinados podem prever psicose com cerca de 80 por cento de precisão em pessoas com síndrome prodrômica. A pesquisa de aprendizado de máquina está entre os muitos esforços em andamento para otimizar os métodos de diagnóstico, identificar novas variáveis ​​e melhorar a precisão das previsões.

Atualmente, não há cura para a psicose.

& # 8220Se pudermos identificar os indivíduos que estão em risco mais cedo e usar intervenções preventivas, poderemos reverter os déficits, & # 8221 diz Walker. & # 8220Há bons dados que mostram que tratamentos como a terapia cognitivo-comportamental podem atrasar o início e talvez até mesmo reduzir a ocorrência de psicose. & # 8221

Para o artigo atual, os pesquisadores primeiro usaram o aprendizado de máquina para estabelecer & # 8220norms & # 8221 para linguagem de conversação. Eles alimentaram um programa de software de computador com as conversas online de 30.000 usuários do Reddit, uma plataforma de mídia social onde as pessoas têm discussões informais sobre uma variedade de tópicos. O software, conhecido como Word2Vec, usa um algoritmo para transformar palavras individuais em vetores, atribuindo a cada um uma localização em um espaço semântico com base em seu significado. Aqueles com significados semelhantes estão posicionados mais próximos do que aqueles com significados muito diferentes.

O laboratório Wolff também desenvolveu um programa de computador para realizar o que os pesquisadores chamaram de & # 8220 descompactação de vetor & # 8221 ou análise da densidade semântica do uso de palavras. Trabalhos anteriores mediram a coerência semântica entre frases. A descompactação do vetor permitiu aos pesquisadores quantificar quanta informação foi compactada em cada frase.

Depois de gerar uma linha de base de dados & # 8220normais & # 8221, os pesquisadores aplicaram as mesmas técnicas a entrevistas diagnósticas de 40 participantes que foram realizadas por médicos treinados, como parte do Estudo Longitudinal Prodrome North American (NAPLS), financiado por os Institutos Nacionais de Saúde. O NAPLS está focado em jovens com alto risco clínico de psicose. Walker é o investigador principal do NAPLS em Emory, uma das nove universidades envolvidas no projeto de 14 anos.

As análises automatizadas das amostras dos participantes foram então comparadas com a amostra normal da linha de base e os dados longitudinais sobre se os participantes se converteram para psicose.

Os resultados mostraram que um uso maior do que o normal de palavras relacionadas ao som, combinado com uma taxa maior de uso de palavras com significado semelhante, significava que a psicose estava no horizonte.

Os pontos fortes do estudo incluem a simplicidade de usar apenas duas variáveis ​​& # 8212, ambas com forte base teórica & # 8212, a replicação dos resultados em um conjunto de dados de validação e a alta precisão de suas previsões, acima de 90 por cento.

& # 8220No campo clínico, muitas vezes nos falta precisão & # 8221 Rezaii diz. & # 8220 Precisamos de maneiras mais quantificadas e objetivas de medir variáveis ​​sutis, como aquelas ocultas no uso da linguagem. & # 8221

Rezaii e Wolff estão agora reunindo conjuntos de dados maiores e testando a aplicação de seus métodos em uma variedade de doenças neuropsiquiátricas, incluindo demência.

& # 8220Esta pesquisa é interessante não apenas por seu potencial de revelar mais sobre doenças mentais, mas por compreender como a mente funciona & # 8212 como ela reúne ideias & # 8221 Wolff diz. & # 8220A tecnologia de aprendizagem da máquina está avançando tão rapidamente que & # 8217s nos fornece ferramentas para minerar dados da mente humana. & # 8221

O trabalho foi financiado por doações do National Institutes of Health e do Google Research Award.


Sobre a possibilidade de modelagem da esquizofrenia por modelos de aprendizado de máquina - Psicologia

"A tecnologia de aprendizado de máquina está avançando tão rapidamente que nos dá ferramentas para minerar dados da mente humana", diz o psicólogo Emory Phillip Wolff, autor sênior do estudo.

Um método de aprendizado de máquina descobriu uma pista oculta na linguagem das pessoas, preditiva do surgimento posterior da psicose & # 8212, o uso frequente de palavras associadas ao som. O jornal npj Schizophrenia publicou as descobertas de cientistas da Emory University e da Harvard University.

Os pesquisadores também desenvolveram um novo método de aprendizado de máquina para quantificar com mais precisão a riqueza semântica da linguagem conversacional das pessoas, um indicador conhecido de psicose.

Seus resultados mostram que a análise automatizada das duas variáveis ​​de linguagem & # 8212 uso mais frequente de palavras associadas a som e fala com baixa densidade semântica ou imprecisão & # 8212 pode prever se uma pessoa em risco desenvolverá psicose posteriormente com 93 por cento de precisão .

Mesmo médicos treinados não notaram como as pessoas em risco de psicose usam mais palavras associadas a sons do que a média, embora a percepção auditiva anormal seja um sintoma pré-clínico.

& # 8220Tentar ouvir essas sutilezas nas conversas com as pessoas é como tentar ver germes microscópicos com os olhos & # 8221 diz Neguine Rezaii, primeira autora do artigo. & # 8220A técnica automatizada que desenvolvemos é uma ferramenta realmente sensível para detectar esses padrões ocultos. É como um microscópio para detectar sinais de psicose. & # 8221

Rezaii começou a trabalhar no papel enquanto era residente na Emory School of Medicine & # 8217s Departamento de Psiquiatria e Ciências do Comportamento. Ela agora é bolsista da Harvard Medical School & # 8217s Department of Neurology.

& # 8220Sabia-se anteriormente que características sutis da psicose futura estão presentes na linguagem das pessoas & # 8217s, mas nós usamos o aprendizado de máquina para realmente descobrir detalhes ocultos sobre essas características, & # 8221 diz o autor sênior Phillip Wolff, professor de psicologia na Emory. O laboratório de Wolff & # 8217s se concentra na semântica da linguagem e no aprendizado de máquina para prever a tomada de decisões e a saúde mental.

& # 8220Nossa descoberta é nova e aumenta as evidências que mostram o potencial do uso de aprendizado de máquina para identificar anormalidades linguísticas associadas a doenças mentais & # 8221 diz a coautora Elaine Walker, professora de psicologia e neurociência da Emory que pesquisa como a esquizofrenia e outras desenvolvem-se transtornos psicóticos.

O início da esquizofrenia e de outros transtornos psicóticos geralmente ocorre no início dos anos 20, com sinais de alerta & # 8212 conhecido como síndrome prodrômica & # 8212 começando por volta dos 17 anos. Cerca de 25 a 30 por cento dos jovens que preenchem os critérios para uma síndrome prodrômica desenvolverão esquizofrenia ou outro transtorno psicótico.

Usando entrevistas estruturadas e testes cognitivos, médicos treinados podem prever psicose com cerca de 80 por cento de precisão em pessoas com síndrome prodrômica. A pesquisa de aprendizado de máquina está entre os muitos esforços em andamento para otimizar os métodos de diagnóstico, identificar novas variáveis ​​e melhorar a precisão das previsões.

Atualmente, não há cura para a psicose.

& # 8220Se pudermos identificar os indivíduos que estão em risco mais cedo e usarmos intervenções preventivas, poderemos reverter os déficits & # 8221, diz Walker. & # 8220Há bons dados que mostram que tratamentos como a terapia cognitivo-comportamental podem atrasar o início e talvez até mesmo reduzir a ocorrência de psicose. & # 8221

Para o artigo atual, os pesquisadores primeiro usaram o aprendizado de máquina para estabelecer & # 8220norms & # 8221 para linguagem de conversação. Eles alimentaram um programa de software de computador com as conversas online de 30.000 usuários do Reddit, uma plataforma de mídia social onde as pessoas têm discussões informais sobre uma variedade de tópicos. O software, conhecido como Word2Vec, usa um algoritmo para transformar palavras individuais em vetores, atribuindo a cada um uma localização em um espaço semântico com base em seu significado. Aqueles com significados semelhantes estão posicionados mais próximos do que aqueles com significados muito diferentes.

O laboratório Wolff também desenvolveu um programa de computador para realizar o que os pesquisadores chamaram de & # 8220 descompactação de vetor & # 8221 ou análise da densidade semântica do uso de palavras. Trabalhos anteriores mediram a coerência semântica entre frases. A descompactação do vetor permitiu aos pesquisadores quantificar quanta informação foi compactada em cada frase.

Depois de gerar uma linha de base de dados & # 8220normais & # 8221, os pesquisadores aplicaram as mesmas técnicas a entrevistas diagnósticas de 40 participantes que foram conduzidas por médicos treinados, como parte do Estudo Longitudinal Prodrome North American (NAPLS), financiado por os Institutos Nacionais de Saúde. O NAPLS está focado em jovens com alto risco clínico de psicose. Walker é o investigador principal do NAPLS em Emory, uma das nove universidades envolvidas no projeto de 14 anos.

As análises automatizadas das amostras dos participantes foram então comparadas com a amostra normal da linha de base e os dados longitudinais sobre se os participantes se converteram para psicose.

Os resultados mostraram que um uso maior do que o normal de palavras relacionadas ao som, combinado com uma taxa maior de uso de palavras com significado semelhante, significava que a psicose estava no horizonte.

Os pontos fortes do estudo incluem a simplicidade de usar apenas duas variáveis ​​& # 8212, ambas as quais têm uma forte base teórica & # 8212, a replicação dos resultados em um conjunto de dados de validação e a alta precisão de suas previsões, acima de 90 por cento.

& # 8220No campo clínico, muitas vezes nos falta precisão & # 8221 Rezaii diz. & # 8220 Precisamos de maneiras mais quantificadas e objetivas de medir variáveis ​​sutis, como aquelas ocultas no uso da linguagem. & # 8221

Rezaii e Wolff estão agora reunindo conjuntos de dados maiores e testando a aplicação de seus métodos em uma variedade de doenças neuropsiquiátricas, incluindo demência.

& # 8220Esta pesquisa é interessante não apenas por seu potencial de revelar mais sobre doenças mentais, mas por compreender como a mente funciona & # 8212 como ela reúne ideias & # 8221 Wolff diz. & # 8220A tecnologia de aprendizagem da máquina está avançando tão rapidamente que & # 8217s nos fornece ferramentas para minerar dados da mente humana. & # 8221

O trabalho foi financiado por doações do National Institutes of Health e do Google Research Award.


Afiliações

Cognitive Systems, Faculty of Arts, University of British Columbia, Vancouver, BC, Canadá

Neuroética do Canadá, Divisão de Neurologia, Departamento de Medicina, Universidade de British Columbia, Vancouver, BC, Canadá

Jacob McFarlane e Judy Illes

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Contribuições

J.M. gerou o conteúdo do artigo, escreveu o primeiro rascunho e trabalhou em estreita colaboração com o supervisor Dr. Illes, que supervisionou todos os aspectos deste trabalho até o produto final.

Autor correspondente


Prevendo resistência ao tratamento em pacientes com esquizofrenia

A esquizofrenia é uma condição de saúde mental grave de longo prazo que causa sintomas psicóticos durante os quais a pessoa pode não ser capaz de distinguir seus próprios pensamentos e ideias da realidade: pessoas com esquizofrenia tendem a ter percepções sensoriais que não são baseadas em estímulos externos (alucinações) , sentimentos persistentes de estar sob ameaça (paranóia) e crenças anormais, que levam à solidão, ao isolamento e à incapacidade de manter suas vidas como estavam antes da doença ocorrer. A taxa de mortalidade por suicídio é de 4 a 13 vezes maior em pessoas com esquizofrenia do que na população em geral, e sua expectativa de vida é 20 anos menor.

Os tratamentos antipsicóticos atualmente disponíveis visam aliviar esses sintomas psicóticos, mas aproximadamente um terço dos pacientes com esquizofrenia não responde a esses medicamentos. Este grupo de pacientes é conhecido por ter esquizofrenia resistente ao tratamento (TRS). Pacientes com SRT apresentam maiores taxas de desemprego, pior qualidade de vida e pior funcionamento social e ocupacional do que aqueles que respondem ao tratamento. Portanto, há uma necessidade de melhorar os resultados desses pacientes.

Aproximadamente um terço dos pacientes com esquizofrenia são resistentes ao tratamento.

Esquizofrenia resistente ao tratamento (TRS): o que é e como é tratada
A esquizofrenia resistente ao tratamento (TRS) é geralmente definida como uma resposta insuficiente a pelo menos dois estudos sequenciais com diferentes medicamentos antipsicóticos de doses adequadas tomadas durante um período de tempo adequado. A clozapina é o único antipsicótico conhecido que é eficaz em pessoas com TRS. No entanto, devido aos seus efeitos adversos, a clozapina é recomendada como tratamento de terceira linha, o que significa que é usada apenas quando dois outros tratamentos antipsicóticos se mostraram ineficazes.

Infelizmente, o TRS muitas vezes não é detectado, o que resulta no início da clozapina após um atraso de alguns anos, ou mesmo na ausência de início. Na verdade, embora as diretrizes de tratamento indiquem que os pacientes podem ser diagnosticados com TRS e prescrita clozapina logo 12 semanas após o início do tratamento antipsicótico, o atraso médio é de 3,9 anos - anos durante os quais os pacientes são tratados de forma inadequada, consequentemente expondo-os e seus entes queridos outros a um longo período de sofrimento desnecessário. Na verdade, a Dra. Ajnakina e sua equipe observaram que, durante um período de cinco anos, apenas metade dos pacientes com TRS começaram o tratamento com clozapina. A outra metade não o iniciou, apesar de atender aos critérios para este tratamento. Encurtar o período de tratamento inadequado antes do início do tratamento com clozapina seria benéfico para os pacientes e seus entes queridos, especialmente porque um atraso mais curto está associado a uma melhor resposta à clozapina e, subsequentemente, à melhoria da qualidade de vida. Uma maneira de fazer isso é identificar os pacientes com probabilidade de desenvolver TRS mais cedo do que no curso de sua doença e acelerar seu acesso ao tratamento com clozapina.

Um benefício crucial dos modelos de previsão é sua capacidade de informar os indivíduos sobre o risco de uma doença.

A esquizofrenia resistente ao tratamento não é uma entidade única
TRS é um fenômeno complexo que décadas de pesquisadores lançaram apenas uma luz limitada sobre nossa compreensão de por que ele se desenvolve. O progresso limitado na pesquisa do TRS feito pode ser devido ao fato de que o TRS estava sendo investigado como uma entidade única, o que pode não ser totalmente preciso. Na verdade, a Dra. Ajnakina e sua equipe estavam entre os primeiros pesquisadores a demonstrar que a esquizofrenia resistente ao tratamento pode ter diferentes subtipos com diferentes causas subjacentes. Especificamente, eles mostraram que cerca de 70% dos pacientes com TRS não responderam aos medicamentos antipsicóticos desde o primeiro tratamento para seus sintomas (isto é, esquizofrenia resistente ao tratamento precoce (E-TR)), enquanto os 30% restantes dos pacientes com TRS, em geral definida como esquizofrenia resistente ao tratamento tardio (L-TR), transição gradual para resistência ao tratamento tendo inicialmente respondido a medicamentos antipsicóticos. Essas descobertas foram inovadoras, pois foram as primeiras a mostrar que, entre os pacientes com esquizofrenia que serão resistentes ao tratamento, uma grande proporção não responderá a nenhum tratamento com medicamentos antipsicóticos não clozapínicos desde o início do tratamento. Pacientes resistentes ao tratamento precoce (E-TR) irão inicialmente responder favoravelmente aos medicamentos antipsicóticos não clozapina, mas gradualmente farão a transição para a resistência ao tratamento, este grupo é conhecido como resistente ao tratamento tardio (L-TR). A alta proporção de pacientes que apresentam E-TR destaca a importância de reduzir o atraso no uso da clozapina, pois todos esses pacientes são tratados inadequadamente por muito tempo. Nesse ínterim, a existência de L-TR complica ainda mais a detecção de TRS, pois os pacientes que respondem ao tratamento podem parar de responder.

Preditores: o que são?
A identificação de fatores de risco relacionados ao cumprimento de critérios para subtipos de TRS permite uma avaliação rápida de um risco individual para subtipos de TRS, que está no centro de uma avaliação de risco mais aprofundada, monitoramento de acompanhamento e estratégias de prevenção individualizadas. Os preditores de TRS são fatores de risco que indicam que um paciente com esquizofrenia tem maior risco de ser resistente ao tratamento. A identificação de tais preditores seria útil para identificar pacientes com TRS mais cedo durante o tratamento, para que eles possam receber a prescrição de clozapina mais cedo. Além disso, os preditores também ajudariam os cientistas a entender as causas do TRS. Diferentes equipes de pesquisadores, incluindo a equipe do Dr. Ajnakina, tentaram identificar preditores de TRS e seus subtipos.

Por exemplo, em um estudo longitudinal, a Dra. Ajnakina e sua equipe relataram que os pacientes tratados com clozapina eram aqueles que, no momento do primeiro contato com os serviços de saúde para esquizofrenia, apresentavam a psicopatologia mais grave. Esse achado indica que um clínico pode estar mais propenso a prescrever clozapina quando a apresentação sintomática da doença é mais grave. Outra diferença observada entre os pacientes com TRS que iniciaram o tratamento com clozapina e aqueles que não o fizeram foi que os pacientes tratados com clozapina eram mais propensos a viver com parentes ou amigos, sugerindo que o início do tratamento com clozapina pode depender do apoio da família e arranjos de vida estáveis . Relatórios de outras equipes indicam que vários fatores como sexo masculino, nascimento no outono ou inverno, funcionamento pré-mórbido pobre e educação rural também podem contribuir para a resistência ao tratamento, embora mais dados sejam necessários para confirmar o papel desses fatores como preditores de TRS .

Para aqueles que desenvolveram uma doença, os modelos de previsão podem estimar a trajetória mais provável da doença.

Modelos de previsão e por que eles são importantes
Um benefício crucial dos modelos de previsão é sua capacidade de informar os indivíduos sobre o risco de uma doença. Para aqueles que desenvolveram uma doença, os modelos de previsão podem instruir sobre a trajetória mais provável da doença. Modelos de previsão confiáveis ​​podem, portanto, orientar as decisões dos médicos para implementar intervenções preventivas ou estratégias de medicina personalizada, para melhorar os resultados dos pacientes.

Para estimar ainda mais precisamente o risco de um paciente desenvolver resistência ao tratamento, é imperativo empregar algoritmos de aprendizagem estatísticos que são reconhecidos como ideais para a previsão de risco personalizada. Isso ocorre porque eles permitirão o desenvolvimento de modelos de predição precisos para estimar o risco individual, em vez da média, de um resultado do transtorno durante a doença, com base nas características do paciente e nos achados clínicos disponíveis. Esses métodos conseguem isso, em vez de olhar para preditores individuais um de cada vez, o que aumenta significativamente o risco de produzir resultados irrealizáveis, levando em consideração todos os preditores ao mesmo tempo em que ajusta para quaisquer vieses que possam estar presentes, como correlacionados entre as variáveis e testes múltiplos.

Tero Vesalainen / Shutterstock.com

Prevendo resistência ao tratamento
Apesar do vasto impacto pessoal e social da esquizofrenia, faltavam medidas preventivas para pessoas em risco de desenvolver a doença e opções de tratamento curativo personalizado para pessoas que desenvolveram a doença. Portanto, a Dra. Ajnakina e sua equipe estão desenvolvendo modelos de previsão confiáveis ​​para estimar um risco individual para E-TR e L-TR, com o objetivo de compreender o risco dos pacientes de desenvolver resistência ao tratamento, especialmente após um período de resposta favorável ao tratamento em curso com medicamentos antipsicóticos.

Tendo se concentrado em fatores conhecidos por estarem associados a resultados ruins de esquizofrenia, como experiências adversas na infância, uso de substâncias e falta de apoio social, eles empregaram métodos de aprendizagem estatística intensiva por computador, particularmente métodos de regressão regularizados, sugeridos como métodos ideais para uso clínico e personalizado previsão de risco.

Os modelos desenvolvidos tiveram boa capacidade discriminativa para identificar aqueles pacientes com esquizofrenia que estavam em um risco maior vs menor para atender aos critérios para E-TR e L-TR. A capacidade discriminativa obtida para cada modelo estava no mesmo nível dos modelos de previsão para doença cardíaca coronária, câncer de mama e doença cardiovascular, que agora estão incluídos nas diretrizes clínicas para gerenciamento terapêutico. Além disso, os modelos de predição desenvolvidos para estimar um risco individual de desenvolver E-TR e L-TR após o início da esquizofrenia mostraram uma forte capacidade de identificar aqueles pacientes com esquizofrenia que não desenvolverão esses subtipos de TRS nos 5 anos seguintes, enquanto a alta especificidade implica que esses modelos provavelmente classificam corretamente uma proporção maior de pacientes com esquizofrenia como de alto risco para subtipos de TRS nos 5 anos seguintes. Assim, a utilização desses modelos na prática pode reduzir as chances de pacientes com esquizofrenia recém-diagnosticados serem expostos a planos de intervenção inadequados projetados para esquizofrenia resistente ao tratamento.

Embora seja necessário mais trabalho para melhorá-los, esses modelos de previsão permitem uma avaliação rápida de um risco individual para subtipos de TRS, o que pode ser útil para implementar estratégias de prevenção individualizadas.

Resposta pessoal

Qual foi o desafio que você enfrentou ao conduzir esta pesquisa e como você o superou?

Quando pesquisadores e médicos falam sobre resistência ao tratamento na esquizofrenia, eles frequentemente, involuntariamente ou não, criam um quadro de desgraça inevitável para os pacientes afetados e seus entes queridos. Este não é o caso! A parte desafiadora deste trabalho foi fornecer um equilíbrio entre a gravidade da doença e a esperança de melhores resultados para as pessoas afetadas. Chegamos a uma era em que, com as ferramentas certas, podemos criar ferramentas de previsão de risco personalizadas para a esquizofrenia que levariam a melhores estratégias de intervenção e prevenção. Lidei com esse desafio revisando criticamente as evidências atuais e incluí uma palavra de cautela para o otimismo excessivo. Sim, nosso trabalho ainda precisa ser aprimorado usando uma amostra maior, mas o primeiro passo é o mais difícil, e certamente o fizemos neste trabalho.


Modulação da dopamina para aprendizagem adaptativa: um modelo neurocomputacional

Tem havido muitas propostas de que as taxas de aprendizagem no cérebro são adaptativas, no sentido de que aumentam ou diminuem dependendo das condições ambientais. A maioria desses modelos são abstratos e não fazem nenhuma tentativa de descrever os circuitos neurais que implementam os cálculos propostos. Este artigo descreve um modelo computacional biologicamente detalhado que supera essa deficiência. Especificamente, propomos um circuito neural que implementa taxas de aprendizado adaptativo modulando o ganho na resposta da dopamina aos erros de previsão de recompensa, e modelamos a atividade dentro desse circuito no nível de neurônios de spiking. O modelo gera um sinal de dopamina que depende do tamanho da população de neurônios dopaminérgicos tonicamente ativos e da taxa de pico fásico. O modelo foi testado com sucesso contra os resultados de dois estudos de registro de neurônio único e um estudo de voltametria cíclica de varredura rápida. Concluímos discutindo a aplicabilidade geral do modelo para tarefas mediadas por dopamina que transcendem os fenômenos experimentais que foi inicialmente projetado para abordar.

Esta é uma prévia do conteúdo da assinatura, acesso através de sua instituição.


Informação sobre o autor

Afiliações

VA Connecticut Healthcare System, Psychology Service, 116-B, 950 Campbell Ave, West Haven, CT, 06516, EUA

Jason K. Johannesen e Joshua G. Kenney

Psiquiatria, Escola de Medicina da Universidade de Yale, New Haven, CT, EUA

Jason K. Johannesen e Joshua G. Kenney

Ciência da computação e engenharia, University of Connecticut, Storrs, CT, EUA

Ciências Psicológicas, Universidade de Connecticut, Storrs, CT, EUA

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Autor correspondente


Resultados

Resultados de métodos automatizados

A Tabela 1 resume os resultados obtidos por métodos automatizados. Os resultados para detecção de SCZ foram muito maiores do que para ASD, com a diferença de até 20% no caso de precisão. Os melhores resultados para ambos os transtornos em termos de precisão foram obtidos pelo classificador SVM com embeddings USE em um cenário de domínio único. A representação BOW produziu resultados relativamente bons. Deve-se também considerar o desempenho da representação de texto POS + LCM + Sentiment no SCZ um sucesso relativo, especialmente com o XG Boost, pois consiste em apenas 21 recursos. Entre as representações de texto Sentic que funcionam com textos em inglês, os vetores AffectNet com SVM mostraram-se os melhores em termos de precisão para SCZ, e vetores AffectiveSpace com SVM para ASD.

Os resultados dos experimentos de aprendizagem por transferência não são diretos. Ao prever ASD por modelos treinados em SCZ, deve-se observar os altos resultados alcançados pelo USE em um cenário de tiro zero, com muito boa precisão e a melhor especificidade observada. No entanto, isso é válido apenas em uma direção, já que os resultados da previsão de SCZ por modelos treinados em ASD são marginalmente próximos do aleatório.

Os resultados da transferência de aprendizagem no cenário com pré-treinamento ([pré-treinamento] na Tabela 1) revelam que não auxiliam no alcance de resultados de ponta. Um classificador de camada densa sem pré-treinamento consegue alcançar resultados ligeiramente, mas visivelmente melhores, do que a variante com pré-treinamento.

No entanto, isso não significa que não haja informações valiosas que alguém possa usar, e parece haver algumas informações relevantes de previsão de ASD nos dados de SCZ. Isso pode ser confirmado não apenas pelo sucesso relativo da abordagem de tiro zero. Na configuração de pré-treinamento ([pré-treinamento]), o treinamento no domínio de origem foi realizado, desde que melhorasse a perda no conjunto de dev que consiste apenas em dados do domínio de destino. Na maioria dos casos, o treinamento continuou por 3 a 6 épocas, em média. Como o treinamento não parou após uma época, isso indica que as primeiras épocas de treinamento melhoraram a perda de dados não apenas de um, mas de ambos os domínios.

Resultados de métodos humanos e automatizados

A Figura 1 ilustra os resultados de humanos e as melhores abordagens baseadas em computador para a detecção de ASD e SCZ.

Precisão de métodos baseados em computador selecionados e linhas de base humanas

Os melhores métodos baseados em computador superam as melhores linhas de base humanas: Avaliadores 1 e 2 diagnosticando SCZ e Avaliadores 3 e 4 diagnosticando ASD. Esta observação é mais significativa no caso de SCZ, mas também é válida para ASD. A aprendizagem de transferência no cenário de tiro zero produz bons resultados de SCZ para ASD, mas não ao contrário (aqui, os resultados aproximam-se da linha de base aleatória de 0,5). Os melhores desempenhos são os embeddings USE com classificador SVM.

Aprendizagem Few-Shot

Métodos de aprendizado profundo geralmente dependem de conjuntos de dados em grande escala com pelo menos milhares de exemplos rotulados. Uma abordagem de aprendizagem de poucas tentativas é proposta para lidar com o problema de pequenas quantidades de dados de treinamento e aprender de forma eficiente com alguns exemplos.

Modificamos o código em um dos repositórios disponíveis publicamente, nota de rodapé 2, e o adaptamos para uso com dados de texto. Em vez de codificadores convolucionais, introduzimos camadas densas, agindo em USE embeddings como entrada em vez de pixels de imagem.

Das várias soluções testadas, a que apresentou os melhores resultados foi a Rede Prototípica [54]. Ele é baseado na suposição de que existe um embedding que os pontos se agrupam, chamado de protótipo. O algoritmo aprende um espaço métrico no qual a classificação pode ser realizada calculando distâncias para as representações de protótipo de cada classe. Depois de amostrar o suporte e os exemplos de consulta, os protótipos são calculados como a média dos embeddings para o conjunto de suporte (amostras rotuladas). A probabilidade de um ponto de consulta pertencer a uma determinada classe é igual ao softmax nas distâncias até os protótipos. Definimos o número de épocas como 30, o tamanho do conjunto de dados da consulta como o parâmetro qt. A configuração é bidirecional (k-way), com um n-parâmetro (n-shot) determinado pelo nt como na Tabela 2, que apresenta os resultados da abordagem de Redes Prototípicas em ambos os conjuntos de dados, em média de 5 experimentos. A tabela também inclui uma configuração de linha de base: resultados médios de um experimento repetido 10 vezes com treinamento de rede neural padrão, com base na representação USE e o classificador denso descrito no início da Seção 2. O tamanho dos conjuntos de treinamento selecionados aleatoriamente não era casos, e os conjuntos de teste consistiam em 20 observações aleatórias. O número de épocas foi definido como 10.

Os resultados indicam que o único conjunto de dados onde o método de aprendizagem de poucas tentativas é aplicável vem de pacientes com SCZ. No caso do ASD, os valores não excedem as linhas de base aleatórias. No caso do SCZ, há uma relação clara entre o aumento da precisão e o número de observações de treinamento. Muito possivelmente, os melhores valores poderiam ser alcançados por conjuntos de treinamento ainda maiores do que os testados. Também está claro que a solução de poucas tentativas de redes prototípicas tem uma vantagem sobre a linha de base do treinamento de rede neural típico.


Aprendizado de máquina e big data: implicações para a modelagem de doenças e descoberta terapêutica em psiquiatria

A capacidade de aprendizado de máquina é uma promessa para informar os modelos de doenças, a descoberta e o desenvolvimento de novas terapias modificadoras de doenças e estratégias de prevenção em psiquiatria. Aqui, fornecemos uma introdução sobre como o aprendizado de máquina / Inteligência Artificial (IA) pode instanciar esses recursos, bem como fornecer uma justificativa para sua aplicação à psiquiatria em ecossistemas clínicos e de pesquisa.

Métodos

Os bancos de dados PubMed e PsycINFO foram pesquisados ​​de 1966 a junho de 2016 para as palavras-chave:Big Data, Aprendizado de Máquina, Medicina de Precisão, Inteligência Artificial, Saúde Mental, Doença Mental, Psiquiatria, Mineração de Dados, RDoC e Critérios de Domínio de Pesquisa. Os artigos selecionados para revisão foram aqueles que foram considerados alinhados com o objetivo deste artigo específico.

Resultados

Os resultados indicam que a IA é uma opção viável para construir preditores úteis de resultados, ao mesmo tempo que oferece métricas de precisão objetivas e comparáveis, uma oportunidade única, particularmente na pesquisa em saúde mental. A abordagem também trouxe, de forma consistente, uma visão notável dos modelos de doenças por meio do processamento da vasta quantidade de dados médicos semiestruturados de vários domínios já disponíveis. A oportunidade para IA em psiquiatria, além do refinamento do modelo da doença, está na caracterização daqueles em risco e provavelmente também é relevante para personalizar e descobrir a terapêutica.


Os conjuntos de dados gerados para este artigo não estão prontamente disponíveis porque os dados brutos não podem ser tornados públicos; se necessário, dados de recursos podem ser fornecidos. As solicitações de acesso aos conjuntos de dados devem ser direcionadas para liuxiaoqian & # x00040psych.ac.cn.

Os estudos envolvendo participantes humanos foram revisados ​​e aprovados pelo comitê de ética em pesquisa científica do Instituto de Psicologia da Academia Chinesa de Ciências (H15010). Os pacientes / participantes forneceram consentimento informado por escrito para participar deste estudo. O consentimento informado por escrito foi obtido do (s) indivíduo (s) para a publicação de quaisquer imagens ou dados potencialmente identificáveis ​​incluídos neste artigo.


Discussão

Até onde sabemos, este é o primeiro estudo até o momento a explorar um método de aprendizado de máquina de ensemble ensemble com o algoritmo de seleção de recursos M5 Prime usando biomarcadores moleculares para a construção de algoritmos preditivos de resultados funcionais em esquizofrenia entre pacientes taiwaneses. Além disso, conduzimos o primeiro estudo para pesquisar prováveis ​​biomarcadores para resultados funcionais de esquizofrenia usando biomarcadores genéticos. Os resultados indicaram que o método de aprendizado de máquina de ensemble ensemble com seleção de recursos usando dois biomarcadores genéticos (G72 rs2391191 e CONHECEU rs2237717 SNPs) ultrapassou outros modelos preditivos de última geração em termos de RMSE para prever o resultado de QLS. Além disso, para prever o resultado do GAF, observamos que o método de aprendizado de máquina de ensemble ensemble com seleção de características usando um biomarcador genético (AKT1 rs1130233) ultrapassou outros algoritmos preditivos de última geração em termos de RMSE.

Tirando vantagem dos biomarcadores genéticos, criamos os algoritmos preditivos de resultados funcionais em pacientes com esquizofrenia usando o método de aprendizado de máquina de ensemble ensemble com o algoritmo de seleção de recursos M5 Prime. Este estudo é uma prova de conceito de uma estrutura preditiva de aprendizado de máquina para prever resultados funcionais da esquizofrenia. Os resultados sugerem que o método de aprendizado de máquina com ensemble ensemble pode fornecer uma ferramenta clinicamente viável para prever os resultados funcionais da esquizofrenia.

Além disso, vale a pena discutir o algoritmo de seleção de recursos M5 Prime para descobrir prováveis ​​biomarcadores neste estudo. Descobrimos que o método de aprendizado de máquina de ensemble ensemble com os biomarcadores selecionados do algoritmo de seleção de recursos M5 Prime ultrapassou consistentemente o método de aprendizado de máquina de ensemble ensemble sem usar a seleção de recursos. Por exemplo, o método de aprendizado de máquina de ensemble ensemble com o conjunto de dados Feature-B superou o método de aprendizado de máquina de ensemble ensemble com o Feature-A na previsão do resultado QLS. Da mesma forma, o modelo de ensemble ensemble com o conjunto de dados Feature-C ultrapassou o método de aprendizado de máquina de ensemble ensemble com o conjunto de dados Feature-A na previsão do resultado GAF. Em outras palavras, o método de aprendizado de máquina com ensemble ensemble com seleção de recursos inclinado a obter valores RMSE mais baixos (quanto melhor o desempenho). Os resultados sugerem que o algoritmo de seleção de recursos M5 Prime pode ter um melhor potencial para isolar biomarcadores que afetam os resultados funcionais da esquizofrenia. Em conformidade, tem sido relatado que os métodos de aprendizagem de máquina com seleção de recursos superaram aqueles sem seleção de recursos na previsão do diagnóstico e resultado do tratamento de transtornos psiquiátricos 10,22,23.

Notavelmente, especulamos ainda os efeitos sinérgicos de biomarcadores escolhidos (nomeadamente o conjunto de dados Feature-B), que foram identificados pelo algoritmo de seleção de recursos M5 Prime quando um conjunto de dados de biomarcadores de 11 variantes genéticas foi utilizado para prever o resultado QLS. Conforme indicado na seção "Resultados", o conjunto de dados do Recurso B compreendia 2 SNPs (a saber G72 rs2391191 e CONHECEU rs2237717) para o resultado QLS. Posteriormente, o método de aprendizado de máquina de ensemble ensemble com seleção de recursos usando o conjunto de dados Feature-B teve melhor desempenho na previsão do resultado QLS entre os algoritmos preditivos. Até onde sabemos, poucos estudos foram investigados para avaliar as ligações causais entre as variantes genéticas. Os mecanismos biológicos dessas ligações causais nos resultados funcionais da esquizofrenia ainda precisam ser elucidados.Foi demonstrado que CONHECEU rs2237717 foi associado à esquizofrenia 19 e G72 rs2391191 também foi associado à esquizofrenia 8. Com base nas descobertas anteriores 8,19, é hipotetizado que as interações sinérgicas entre variantes genéticas podem fornecer uma marca dos efeitos moleculares sobre os resultados funcionais da esquizofrenia.

Em conclusão, construímos um método de aprendizado de máquina com ensemble ensemble com seleção de recursos para prever resultados funcionais de esquizofrenia em pacientes taiwaneses usando biomarcadores genéticos. A análise revela que o método de aprendizado de máquina com ensemble ensemble com seleção de recursos pode apresentar uma ferramenta plausível para construir modelos preditivos para resultados funcionais de esquizofrenia em termos de desempenho favorável. No entanto, é fundamental investigar mais a fundo o papel do método de aprendizado de máquina de ensemble ensemble por meio de mais estudos de replicação. Em última análise, esperaríamos que os achados do presente estudo pudessem ser generalizados na psiquiatria de precisão para predizer o diagnóstico e os resultados do tratamento para vários transtornos psiquiátricos. Além disso, as descobertas podem ser provavelmente aproveitadas para desenvolver ferramentas de diagnóstico e prognóstico moleculares em um futuro próximo.


Materiais e métodos

Este estudo foi aprovado pelo conselho de revisão institucional do China Medical University Hospital em Taiwan e foi conduzido de acordo com a Declaração de Helsinque.

População de estudo

A coorte do estudo consistiu de 302 pacientes com esquizofrenia, que foram recrutados no China Medical University Hospital e afiliado ao Taichung Chin-Ho Hospital em Taiwan 5. Neste estudo, os pacientes com esquizofrenia tinham 18 & # x0201365 & # x000a0anos e eram saudáveis ​​nas condições físicas. Depois de apresentar uma descrição completa deste estudo aos sujeitos, obtivemos consentimento informado por escrito de um dos pais e / ou responsável legal, de acordo com as diretrizes do conselho de revisão institucional. Detalhes do diagnóstico de esquizofrenia foram publicados anteriormente 5.

Escalas de sintomas clínicos

Neste estudo, empregamos 3 escalas de sintomas clínicos para avaliar sintomas positivos, negativos e depressivos 5, incluindo a subescala PANSS-Positiva 34, SANS20 35 e HAMD17 36.

Pontuação de função cognitiva

Empregamos 11 escores de função cognitiva para avaliar as funções cognitivas 5, incluindo fluência de categoria, trail making A, codificação de símbolos de dígitos (Wechsler Adult Intelligence Scale, terceira edição (WAIS-III)), d-Prime da versão clara, d-Prime de versão borrada, memória de trabalho verbal, memória de trabalho não verbal, aprendizagem e memória verbal, aprendizagem e memória visual, raciocínio e resolução de problemas e cognição social. Em resumo, esses 11 escores de função cognitiva foram usados ​​para avaliar 7 domínios cognitivos, como velocidade de processamento, atenção sustentada, memória de trabalho, aprendizagem verbal e memória, aprendizagem visual e memória, raciocínio e resolução de problemas e cognição social 5. A velocidade do domínio de processamento foi avaliada usando fluência de categoria, criação de trilha A e codificação de símbolos de dígitos WAIS-III. O domínio de atenção sustentada foi avaliado usando d-Prime da versão clara e d-Prime da versão borrada. O domínio da memória operacional foi avaliado por meio da memória operacional verbal e da memória operacional não verbal.

Resultados funcionais

Medimos os resultados funcionais usando o QLS 1 e a escala GAF do DSM-IV 2. QLS é uma ferramenta para fornecer a classificação de resultados funcionais na esquizofrenia, incluindo atividade social, iniciativas sociais, isolamento social, senso de propósito, motivação, curiosidade, anedonia, inatividade sem objetivo, capacidade de empatia, interação emocional 8. GAF é uma ferramenta que fornece uma medida para avaliar o funcionamento psicológico, social e ocupacional global na esquizofrenia 2.

Análise estatística

O teste t de Student & # x02019s foi realizado para medir a diferença nas médias de duas variáveis ​​contínuas 37. Foi realizado o teste do qui-quadrado para dados categóricos. O critério de significância foi estabelecido em P& # x02009 & # x0003c & # x020090.05 para todos os testes. Os dados são apresentados como a média & # x02009 & # x000b1 & # x02009 desvio padrão.

Com a suposição de que um nível de confiança de 95% e uma proporção de 0,5, uma fórmula simplificada 38 foi usada para calcular os tamanhos de amostra da seguinte forma: n& # x02009 = & # x02009N / (1 & # x02009 + & # x02009N (e) 2), onde n é o tamanho da amostra, N é o tamanho da população, e e é o nível de precisão. Neste estudo, presumimos que N& # x02009 = & # x02009230.000 e e& # x02009 = & # x020090.06.

Modelos preditivos de ensemble ensemble

Empregamos uma técnica de aprendizado de máquina de conjunto chave chamada preditores de bagging 25 e utilizamos o software Waikato Environment for Knowledge Analysis (WEKA) (que está disponível em https://www.cs.waikato.ac.nz/ml/weka/) 26 para realizar a estrutura preditiva do ensemble ensemble. Além disso, outras ferramentas de software de aprendizado de máquina podem ser empregadas, por exemplo, Pattern Recognition for Neuroimaging Toolbox (PRoNTo http://www.mlnl.cs.ucl.ac.uk/pronto/) e NeuroMiner (https: // github. com / neurominer-git). Todos os experimentos foram conduzidos em um computador com Intel (R) Core (TM) i5-4210U, 4 & # x000a0GB RAM e Windows 7 21. Deve-se notar que utilizamos o método de validação cruzada repetida em dez vezes para examinar a generalização dos preditores de bagging 21, 32, 39.

A Figura & # x000a0 1 mostra o diagrama ilustrativo da estrutura preditiva de ensemble ensemble com seleção de recursos. A técnica do algoritmo preditivo de ensemble de bagging é usada para combinar o desempenho preditivo de várias versões de um preditor de base para atingir um preditor agregado com maior precisão. As múltiplas versões do preditor de base são formadas pelo método bootstrap, onde o método bootstrap é um dos métodos de reamostragem de dados mais populares usados ​​em análises estatísticas. A técnica do algoritmo preditivo ensemble bagging tende a reduzir a variância e evitar overfitting. O preditor básico que empregamos foi MFNNs ou SVM. Aqui, usamos os parâmetros padrão do WEKA, como 100 para o tamanho do lote, 100 para a porcentagem do tamanho da sacola e 10 para o número de iterações 21, 40.

A ilustração esquemática do algoritmo preditivo de conjunto de ensacamento com seleção de recursos. Primeiro, o algoritmo de seleção de recursos M5 Prime é executado para selecionar um subconjunto de recursos, que serve como entrada para o algoritmo preditivo de conjunto de ensacamento. A ideia do algoritmo preditivo de ensemble bagging é gerar as várias versões de um preditor de base por replicações de bootstrap. A previsão final é então produzida pela média do desempenho preditivo das várias versões. O preditor de base foi escolhido como redes neurais multicamadas feedforward (MFNNs) ou máquina de vetor de suporte (SVM) neste estudo. GAF & # x02009 = & # x02009 Avaliação global do funcionamento QLS & # x02009 = & # x02009 Escala de qualidade de vida.

Algoritmos de aprendizado de máquina para benchmarking

Para a tarefa de benchmarking no presente estudo, utilizamos 4 algoritmos de aprendizado de máquina de última geração, incluindo MFNNs, SVM, regressão linear e florestas aleatórias. Realizamos as análises para esses 4 algoritmos de aprendizado de máquina usando o software WEKA 26 e um computador com Intel (R) Core (TM) i5-4210U, 4 & # x000a0GB RAM e Windows 7 21. Outras ferramentas de software de aprendizado de máquina, como PRoNTo (http://www.mlnl.cs.ucl.ac.uk/pronto/) e NeuroMiner (https://github.com/neurominer-git) também podem ser usadas. Deve-se notar que utilizamos o método de validação cruzada de dez vezes repetido para examinar a generalização desses 4 algoritmos de aprendizado de máquina 21, 32, 39.

Uma estrutura MFNN consiste em uma camada de entrada, uma ou várias camadas ocultas e uma camada de saída, onde cada camada contém estruturas de neurônios e as conexões entre as estruturas de neurônios não contêm ciclos direcionados 21, 41. Em geral, o algoritmo de retropropagação 42 é amplamente aproveitado para treinar a estrutura MFNN, em que o algoritmo de retropropagação atualiza os pesos das estruturas de neurônios nas camadas da estrutura MFNN 21, 43. Neste estudo, usamos a arquitetura contendo 1 camada oculta. Por exemplo, usamos os seguintes parâmetros WEKA & # x02019s para treinar o modelo MFNN com 1 camada oculta: o momento & # x02009 = & # x020090.01, a taxa de aprendizagem & # x02009 = & # x020090.01 e o tamanho do lote & # x02009 = & # x02009100 21, 40.

O algoritmo SVM 44 é uma técnica popular para reconhecimento e classificação de padrões 21. O algoritmo SVM, que é baseado na teoria de aprendizagem estatística, encontra uma relação linear entre as variáveis ​​de entrada e a variável dependente (ou seja, a saída prevista) 44, 45. O melhor modelo para a saída prevista é obtido minimizando os coeficientes da função de custo e os erros preditivos, onde a função de custo consiste nos coeficientes de regressão e um termo de erro 44, 45. Neste estudo, usamos o kernel polinomial com o valor expoente de 1,0 24.

O modelo de florestas aleatórias combina uma coleção de árvores de decisão, onde uma árvore de decisão é definida como uma árvore invertida com três tipos de nós, como um nó raiz, nós internos e nós folha 21, 46. O modelo de florestas aleatórias é conceituado para obter uma melhor previsão agregando os resultados preditivos de uma coleção de árvores de decisão 21, 46. Aqui, usamos os parâmetros padrão do WEKA para o modelo de florestas aleatórias, por exemplo, 100 para o tamanho do lote e 100 para o número de iterações 21.

O modelo de regressão linear, o método padrão para problemas de predição em aplicações clínicas, foi usado como base de comparação 21, 26. A regressão linear é adequada para avaliar a relação entre uma resposta escalar (isto é, uma variável dependente) e variáveis ​​explicativas (isto é, variáveis ​​independentes) ajustando uma equação linear aos dados 21, 26.

Algoritmo de seleção de recursos M5 Prime

No presente estudo, utilizamos uma abordagem baseada no critério de informação de Akaike (AIC) chamada de algoritmo M5 Prime 26 para a tarefa de seleção de recursos. O algoritmo M5 Prime constrói uma árvore de decisão com modelos lineares multivariados nos nós terminais e remove iterativamente o recurso com o menor coeficiente padronizado até que nenhuma melhoria adicional no erro estimado definido pelo AIC 47, 48. Além disso, utilizamos o método de validação cruzada de dez vezes para examinar a generalização da tarefa de seleção de recursos 21, 32, 39.

Para prever o QLS e o GAF, usamos o algoritmo M5 Prime para selecionar recursos de 2 conjuntos de dados de recursos diferentes (Fig. & # X000a0 1). O primeiro conjunto de dados de recursos inclui 3 escalas de sintomas clínicos. O segundo conjunto de dados de recursos inclui 11 pontuações de função cognitiva.

Avaliação do desempenho preditivo

Neste estudo, utilizamos um dos critérios mais populares, o RMSE, para avaliar o desempenho de modelos preditivos 32, 45, 49. O RMSE calcula a diferença entre os valores medidos e os valores estimados por um modelo preditivo. Quanto melhor for o modelo de previsão, menor será o RMSE 32, 49. Além disso, utilizamos o método de validação cruzada de dez vezes repetido para examinar a generalização de modelos preditivos 21, 32, 39. Primeiro, todo o conjunto de dados foi dividido aleatoriamente em dez segmentos separados. Em segundo lugar, o modelo preditivo foi treinado usando nove décimos dos dados e foi testado usando o décimo restante dos dados para avaliar o desempenho preditivo. Em seguida, a etapa anterior foi repetida mais nove vezes, deixando de fora nove décimos dos dados como dados de treinamento e um décimo distinto dos dados como dados de teste. Finalmente, a estimativa média foi relatada em todas as execuções, processando a validação cruzada de dez vezes acima mencionada por 10 vezes com lotes de dados distintos. Estimamos o desempenho de todos os modelos preditivos usando o método de validação cruzada repetida de dez vezes.


Assista o vídeo: Informática Análise de Informação - Aprendizado de Máquina (Agosto 2022).