Em formação

Os campos receptivos extra-clássicos são surpreendentes, mas os campos receptores dos gânglios retinais não. Porque?

Os campos receptivos extra-clássicos são surpreendentes, mas os campos receptores dos gânglios retinais não. Porque?

Rao e Ballard (1999) começam seu artigo afirmando que os campos receptivos extra-clássicos, que exibem o fenômeno de parada final, são difíceis de explicar. Eles mostram que em um modelo de codificação preditivo idealizado treinado em imagens naturais, os "neurônios" em um nível superior no modelo têm um campo receptivo que exibe parada final; portanto, se os neurônios no cérebro estão implementando codificação preditiva, eles exibiriam esse fenômeno.

O que eu não entendo é isso - por que é difícil explicar campos receptivos extra-clássicos? Afinal, os neurônios ganglionares da retina que estão no centro também exibirão "parada final" se um estímulo se estender para fora do centro, e a explicação para esse campo receptivo é direta: os fotorreceptores na periferia hiperpolarizam a célula ganglionar, enquanto aqueles no centro, despolariza-o. Por que uma história semelhante não pode ser contada sobre neurônios corticais? Por que a estrutura de codificação preditiva foi necessária para explicar a parada final?


A diferença é que os neurônios ganglionares estão respondendo diretamente aos fenômenos no seu campo receptivo. Ou seja, as células ganglionares no centro e fora do ambiente estão diretamente conectadas aos fotorreceptores no centro e no ambiente. A explicação para o off-surround é que os fotorreceptores na periferia irão hiperpolarizar diretamente a célula ganglionar.

Os efeitos do campo receptivo extraclássico explicam como um neurônio (por exemplo, em V1) responde aos fenômenos lado de fora seu campo receptivo. Ou seja, é possível mapear toda a porção do campo visual à qual ele está conectado, por exemplo, passando um estímulo através do campo visual e observando todas as regiões onde os trens de picos são evocados pelo estímulo. Essa parte do campo visual é conhecida como campo receptivo clássico. Acontece que os neurônios V1 podem ser influenciados por estímulos lado de fora seu campo receptivo clássico. Ao contrário da "parada final" nos neurônios ganglionares da retina, isso não pode ser explicado pela hiperpolarização de entrada na periferia do campo receptivo, porque o estímulo que causa a parada final é não em seu campo receptivo em primeiro lugar.


Discussão

Nossos resultados demonstram que o sistema visual nem sempre reduz a supressão surround para aumentar a integração espacial quando um recurso de estímulo importante é ruidoso. Quando testamos neurônios MT com estímulos de movimento estocástico que nos permitiam variar sistematicamente a força do sinal de movimento preferido, mantendo o contraste geral constante, descobrimos que a coerência de baixo movimento tendia a aumentar, e não diminuir, a supressão surround, produzindo assim uma menor integração cercar. Este resultado um tanto surpreendente é provavelmente atribuível à ativação da supressão surround pelo movimento em direções não preferidas. Consistente com isso, descobrimos que o ajuste de direção da supressão surround em MT era, em geral, extremamente amplo.

Trabalhos anteriores mostraram que os neurônios MT são menos suprimidos do surround para estímulos de baixo contraste (Pack et al., 2005) e que, em geral, os efeitos do surround se tornam mais integrativos quando o movimento fraco ou ambíguo está presente no centro do campo receptivo (Huang et al. ., 2007, 2008). Esses resultados foram unificados pela ideia de que a incerteza de movimento leva a uma maior integração dos neurônios MT (Huang et al., 2007). Essa incerteza pode ser criada reduzindo a razão sinal-ruído, diminuindo o contraste ou adicionando ruído de movimento, como foi feito em nossos experimentos, ou gerando movimento cuja direção é ambígua por causa do & # x0201 problema de abertura & # x0201d ( Marr e Ullman, 1981). No último caso, o sinal de movimento pode ser forte (por exemplo, produzido por um alto contraste, contorno unidimensional visto através de uma abertura circular), mas sua verdadeira direção bidimensional de movimento é incerta porque é consistente com uma faixa de possíveis direções bidimensionais. Tecnicamente falando, então, não se deve igualar ambigüidade de movimento com baixo sinal-ruído. No entanto, ambos produzem incerteza de movimento e, curiosamente, os contornos longos que criam o problema de abertura tendem a produzir taxas de resposta consideravelmente mais baixas em neurônios MT do que os estímulos que colocam & # x0201 condicionadores, & # x0201d, como pontos e barras curtas, em o centro de campo receptivo (Huang et al., 2008). Nesse sentido, todas as classes de estímulos que produzem incerteza de movimento (baixo contraste, baixa coerência e contornos longos) tendem a ser menos eficazes na condução de neurônios MT do que aquelas que não o fazem.

Como todas as três classes de estímulos que produzem incerteza de movimento demonstraram aumentar a integração do movimento perceptualmente (Lorenceau e Shiffrar, 1992 Watamaniuk e Sekuler, 1992 Murakami e Shimojo, 1993), previmos que pontos aleatórios de baixa coerência fariam com que os neurônios MT mostrassem maior facilitação para movimento de direção preferencial no entorno ou, pelo menos, menos supressão. Nossos resultados, no entanto, foram contra essa previsão. Uma possível explicação trivial reside nas diferentes maneiras em que a modulação surround pode ser estudada: como facilitação versus supressão, que se refere ao efeito de um determinado surround na taxa de disparo de um neurônio, ou como integração versus antagonismo, que mede o relativo ajuste da direção do entorno em relação ao centro. Embora relacionadas, as duas maneiras diferentes de caracterizar as interações centro & # x02013surround não são idênticas & # x02014 por exemplo, o antagonismo é frequentemente caracterizado pela supressão do movimento de direção preferencial e facilitação para o movimento de direção nula (Allman et al., 1985a Born and Tootell, 1992 Born, 2000). Os experimentos nos quais sistematicamente variamos a coerência do movimento não variaram a direção do surround, então não podemos falar sobre mudanças na afinação da modulação surround e, portanto, de acordo com a definição acima, não podemos avaliar as mudanças na integração versus antagonismo que foram medidas por Huang et al. (2007, 2008). No entanto, a forte previsão da hipótese de incerteza de movimento é que as respostas de direção preferidas no ambiente devem se tornar facilitadoras ou, pelo menos, menos supressivas à medida que a relação sinal-ruído do estímulo diminui, e encontramos exatamente o oposto. Interpretamos isso como significando que a interação centro & # x02013surround não é tão sofisticada quanto se poderia esperar, e que essa lacuna aponta para uma imagem mais mecanicista do ambiente.

Circunda como uma manifestação de normalização

O quadro geral do entorno de MT que emerge deste estudo e de outros é que ele parece agrupar sinais com muito menos seletividade do que o centro ao longo de várias dimensões diferentes, em linha com a noção de que é apenas uma manifestação de normalização divisiva (Heeger , 1992 Carandini et al., 1997 Cavanaugh et al., 2002). Na verdade, a baixa seletividade de um & # x0201c pool de normalização & # x0201d ao longo de três dimensões & # x02014 retinotopia, direção e fluxo de entrada & # x02014 pode potencialmente explicar muitas características dos arredores do campo receptivo. O agrupamento retinotópico mais amplo é o que produz o fenômeno de um entorno espacial maior e não clássico, em primeiro lugar. O agrupamento menos seletivo de direções é responsável por uma supressão mais forte em coerências baixas, uma vez que esses estímulos, que têm energia de movimento distribuída em todas as direções, seriam relativamente mais eficazes para o ambiente menos seletivo do que para o centro mais seletivo. Finalmente, a supressão de surround reduzida em baixo contraste pode simplesmente refletir uma sensibilidade de contraste inferior do surround, em relação ao centro. Isso poderia ser explicado pela inclusão de entradas de ambos os fluxos M (magnocelular) e P (parvocelular) no entorno, embora outras explicações sejam possíveis dadas as respostas de contraste não linear dos neurônios que fornecem entrada para MT (JM Tsui e CC Pack , observações não publicadas). Se o mecanismo central integra seletivamente a entrada do fluxo M, seria de se esperar alta sensibilidade ao contraste e saturação relativamente rápida das respostas, conforme documentado anteriormente (Sclar et al., 1990). A inclusão de entrada de fluxo P no conjunto de normalização que compreende o surround pode fornecer impulso adicional além do ponto onde as respostas de fluxo M saturam, maximizando assim a influência do surround em contrastes mais altos. Embora esta ideia seja especulativa, é apoiada pelo domínio do fluxo M da chamada via & # x0201cdirect & # x0201d para MT da camada 4B de V1 (Yabuta et al., 2001 Nassi e Callaway, 2006) e o M misto e entradas P que chegam em MT tanto das vias & # x0201cindirect & # x0201d via áreas V2 e V3 (Yabuta et al., 2001) ou via células de Meynert da camada 6 de V1 (Nassi et al., 2006). É ainda apoiado por uma diminuição modesta, mas significativa, na supressão surround observada quando as entradas indiretas para MT são reversivelmente inativadas (C. R. Ponce, J. N. Hunter, C. C. Pack, S. G. Lomber e R. T. Born, observações não publicadas).

Modificações sugeridas para modelos existentes

Vários grupos propuseram modelos de rede recorrentes de interações centro & # x02013surround (Somers et al., 1998 Schwabe et al., 2006 Huang et al., 2008) que compartilham duas características principais que governam o equilíbrio de excitação e inibição em circuitos corticais. Em particular, eles postulam que os mecanismos inibitórios têm (1) um limite mais alto, exigindo mais impulso de entrada antes de responder, e (2) uma função de ganho mais acentuada de modo que, uma vez ativados, eles ultrapassam rapidamente a excitação e suprimem as respostas neurais. Isso tem o efeito de que os arredores podem parecer supressivos ou facilitadores, dependendo da intensidade geral da entrada para o circuito, e podem ser responsáveis ​​por fenômenos importantes, como a dependência de contraste da supressão do ambiente (Pack et al., 2005, este estudo) e os efeitos diferenciais dos estímulos surround quando o movimento central é ambíguo (Huang et al., 2007, 2008). Em suas formas atuais, no entanto, esses modelos são incapazes de explicar os resultados que obtivemos com estímulos de movimento de coerência variável em que, para muitos neurônios MT (Fig. 2 B), um estímulo de baixa coerência fornece impulso geral mais fraco (como evidenciado pela taxa de disparo mais baixa para o estímulo restrito ao centro do campo receptivo), mas, no entanto, evoca uma supressão mais forte à medida que invade o ambiente. Propomos que isso pode ser facilmente remediado se o ajuste mais amplo do mecanismo surround for levado em consideração. A partir desta perspectiva, as relações básicas entre excitação e inibição nos modelos de rede recorrente não precisam mudar o que mudaria é que o mecanismo inibitório (referido como & # x0201c pool de normalização & # x0201d acima) somaria entradas ativadas por uma gama maior de visuais estímulos. Isso é consistente tanto com nossas medições da ampla sintonia de direção dos arredores de MT quanto com a descoberta de que, pelo menos em V1, os interneurônios inibitórios são muito mal sintonizados para orientação (Sohya et al., 2007 Niell e Stryker, 2008).

Um problema potencial com o argumento acima é que não está claro se os estímulos de baixa coerência de fato fornecem uma entrada mais fraca para o mecanismo central dos neurônios MT. Acredita-se amplamente que as taxas de disparo mais baixas para tais estímulos são atribuíveis a & # x0201 movimento de oposição & # x0201d & # x02014 a propriedade pela qual as respostas aos estímulos de direção preferida confinados ao centro do campo receptivo são suprimidas quando o movimento de direção nula é adicionado & # x02014 e que isso é calculado dentro de MT. A evidência de que a oponência de movimento é um cálculo de MT baseia-se principalmente na observação de que a propriedade é comum em MT, mas rara em V1 (Snowden et al., 1991 Qian e Andersen, 1994). No entanto, há uma forte oposição de movimento em uma minoria significativa de células V1 [por exemplo, consulte Snowden et al. (1991), sua Fig. 4 Qian e Andersen (1994), sua Fig. 15], e é possível que esses neurônios oponentes de movimento sejam os que se projetam para MT. Certamente há precedentes para uma seletividade extremamente alta em que os neurônios V1 se projetam para MT em termos de sua seletividade de direção [Movshon e Newsome (1996), sua Fig. 4]. Uma segunda dificuldade em atribuir efeitos à oponência de movimento dentro do centro é que é impossível ativar apenas o centro, uma vez que é claro que o ambiente é espacialmente contínuo ao longo do campo receptivo (DeAngelis et al., 1994 Sceniak et al., 2001 Cavanaugh et al., 2002). Ou seja, a verdadeira forma do contorno é Gaussiana, não um anel. Isso significa que um mecanismo supressor & # x0201csurround & # x0201d amplamente ajustado na direção também contribuiria para a oposição de movimento observada no centro. Dessa perspectiva, tanto o surround supressor quanto a oponência de movimento seriam manifestações diferentes de um único mecanismo de normalização.


Os SOMs

Uma característica chave dos neurônios corticais visuais é sua sintonia seletiva com o tamanho e a orientação dos objetos no campo visual (Angelucci e Bressloff, 2006). Adesnik et al. (2012) investigou a contribuição da supressão surround para ajuste de tamanho no córtex visual do mouse (V1). Em camundongos com comportamento desperto, grades à deriva foram apresentadas em uma abertura circular de tamanho crescente para determinar o tamanho de estímulo preferido para células piramidais (PCs) e duas populações de neurônios inibitórios na camada II / III em V1. O ajuste do tamanho do PC foi determinado por meio de gravações extracelulares de unidades únicas, enquanto as gravações de patch solto foram empregadas para determinar o ajuste do tamanho em neurônios que expressam parvalbumina (PVs) e neurônios que expressam somatostatina (SOMs). Os PCs exibiram sintonia preferida para aberturas relativamente pequenas (em torno de 22 & # x000B0), enquanto PVs e SOMs preferiram sintonização para aberturas maiores (Figuras 1B, B & # x02032). Ambos os PCs e PVs exibiram supressão surround (como o tamanho do estímulo aumentou fora do RF do neurônio, a taxa de disparo diminuiu). Significativamente, além de ter RFs maiores do que PCs e PVs, os SOMs não exibiram supressão de surround.

Como as entradas para SOMs são estruturadas para gerar grandes RFs sem supressão de surround? Adesnik et al. (2012) determinaram que os SOMs somam a excitação através do espaço visual por meio da excitação lateral dos PCs na camada II / III. Durante a gravação dos SOMs e ativação direta dos PCs da camada IV que expressam a canalrodopsina (ChR2), observou-se pouca excitação nos SOMs. Em contraste, a ativação mediada por ChR2 de PCs de camada II / III resultou em grandes aumentos no impulso excitatório para SOMs. Ao gravar simultaneamente de PCs na camada II / III, os autores foram capazes de fazer comparações entre a atividade do SOM e a atividade do PC enquanto estimulavam cada camada. Ao contrário do impulso excitatório lateral para os SOMs, os PVs pareciam receber a maior parte de sua entrada excitatória dos PCs da camada IV.

Em experimentos de eletrofisiologia realizados durante a expressão de halorodopsina (NpHR) em SOMs e ChR2 em PCs de camada II / III, os autores confirmaram que a ativação de PC de camada II / III resultou em aumento da entrada excitatória e aumento de SOMs com o efeito oposto em PCs que não expressam ChR2 & # x02013 aumentou as correntes pós-sinápticas inibitórias (IPSCs) e diminuiu o spiking. Quando os SOMs foram silenciados com a ativação de NpHR durante essas gravações duplas de SOMs e PCs vizinhos, o aumento de SOM foi reduzido e a inibição de PCs foi perdida (medida pela diminuição de IPSCs). Esses experimentos sugeriram que os SOMs são responsáveis ​​pela inibição de PC observada durante a apresentação de um grande estímulo visual (Figura 1B e # x02032). Os resultados de Adesnik et al. (2012) são semelhantes aos achados de Del Bene et al. (2010) ao demonstrar que (1) há um microcircuito anatomicamente identificável para filtragem de tamanho e (2) a filtragem de tamanho não é apenas transmitida por entrada de estágios anteriores do processamento visual, mas pode ser calculada diretamente nas regiões cerebrais visuais.


Representação retinal / cortical multiescala / biologia e modelagem

Hubel e Wiesel [92] mostraram que nosso sistema visual tem um mecanismo de filtragem multiescala e de orientação denominado sintonizador de orientação com representação colunar de células corticais. Em contraste, outras investigações clássicas como Barlow [93] e Kuffler [94] sugeriram que a codificação da imagem na retina é baseada em um mecanismo de organização centro-circundante em camadas sucessivas da retina também conhecidas no córtex.

Embora as evidências fisiológicas da existência de filtragem multiescala nos campos receptivos da retina sejam bem conhecidas, destacamos a alteração do tamanho das células ganglionares (GCs) com excentricidade (ou seja, sua distância da fóvea). Um estudo biológico recente [1] indica que existem pelo menos 17 GCs distintos na retina. Cada tipo tem uma gama diversificada de tamanho em relação à excentricidade dos neurônios e à distância da fóvea. Os gânglios da camada, cobrindo a retina, incluem, portanto, diferentes tamanhos e escalas de neurônios receptivos, resultando em uma codificação retinal multiescala da entrada visual que será enviada ao córtex. Essa é nossa suposição para o processamento visual de baixo nível na retina. Existem outros fatores que reforçam essa suposição, como "movimentos fixos dos olhos" [75], que são essenciais para evitar o desbotamento de todo o mundo visual. Portanto, os olhos nunca ficam parados e, mesmo quando estamos fixando, há um mecanismo visual de imagem retiniana continuamente deslocada na retina por fator de alguns GCs de 10–100 s devido ao tipo de movimentos oculares de fixação. Isso inclui microssaccades, tremores e desvios, que são fontes inconscientes dos movimentos oculares. Existem também movimentos oculares conscientes, como sacadas que resultam em diferentes sensações nas células da retina. Todas as evidências acima mencionadas indicam a representação da filtragem multiescala na retina devido à relação de excentricidade dos tamanhos dos GCs, que é sua distância da fóvea.

Além da natureza multiescala da representação da retina, também foi demonstrado que alguns campos receptivos da retina têm um contorno muito estendido visto no mecanismo lateral de células horizontais e amácrinas na retina em comparação com o tamanho dos campos receptivos clássicos da retina (CRFs). A ideia de campos receptivos não clássicos (nCRFs) foi introduzida pela primeira vez por Passaglia et al. [95] com modelagem de RFs com base em surround amplamente difundido. Esta representação fornece algumas evidências até mesmo para células de ajuste de orientação específicas na retina. Portanto, a saída visual da retina contém não apenas o mapa de bordas com informações de bordas multiescala, incluindo as sombras e o perfil de brilho em torno das bordas, mas também suas orientações como resultado de multiescala e processamento de orientação de algumas células da retina. Isso, junto com outras evidências, sugere que em muitos estágios de nosso processamento visual, há um ajuste de filtragem espacial envolvido, como os movimentos dos olhos, o que cria um mecanismo de tamanho espacial adaptável nas células ganglionares da retina [54]. Shapiro e Lu [64] argumentam que para a percepção de brilho, o tamanho do filtro espacial é relativo ao tamanho do objeto em toda a imagem, o que é consistente com a literatura de visão espacial e não com a frequência espacial da retina. Nosso modelo DoG tem a mesma propriedade.

A implementação dos campos receptivos (RFs) na retina e no córtex com base nas diferenças de gaussianas (DoGs) remonta a 1960, quando Rodieck e Stone [96] e Enroth-Cugell e Robson [97] mostraram um modelo eficiente para as respostas das células ganglionares da retina e o efeito antagonista centro-circundante. As explicações para algumas ilusões geométricas, como Mach Bands, SBC e Hermann Grid, baseiam-se na 'Inibição Lateral' e na 'sensibilidade ao contraste' dos RGCs [98, 99].Um modelo de ontogênese de funções de interação lateral foi derivado matematicamente por Powers [100] mostrando teoricamente que era possível para tipos comumente assumidos de função de interação lateral se auto-organizar e, em particular, aproximar os modelos DoG e LoG, bem como outros modelos relacionados às distribuições Poisson e Gaussiana. Considerando como isso se inicializa para um modelo de nível superior, tais distribuições podem então explicar os padrões repetidos de detectores de borda em ângulos específicos por meio de um modelo auto-organizado [101]. Nossa investigação é baseada na aplicação de um modelo de filtragem DoG de baixo nível, simulando as respostas dos RGCs ao estímulo da Ilusão da telha, para encontrar uma explicação inibitória lateral para essas ilusões.

Apesar da controvérsia em relação às explicações de baixo nível para ilusões de brilho / luminosidade simultâneas, por exemplo [98, 102,103,104], as técnicas de filtragem de baixo nível mostraram seu grande poder em lidar com ilusões do tipo induções de brilho / luminosidade, por exemplo [31, 67, 105, 106 ] Alguns desses modelos constroem seus métodos na implementação de nCRFs, como [17, 68], usando surround alongado para a seletividade de orientação de alguns RF retinais ou células corticais. As ilusões de azulejo podem ter algumas semelhanças com as ilusões de brilho / luminosidade, mas geralmente recebem explicações diferentes [42, 45, 107,108,109,110]. Esclarecemos que, para ilusões de inclinação, devemos prever e medir a orientação de inclinação, não as alterações do perfil de brilho, o que é necessário para as explicações de indução de brilho, embora a análise de brilho possa nos fornecer mais pistas com efeito indireto sobre a inclinação.

Em nossas investigações anteriores [48,49,50], mostramos que um modelo de campo receptivo clássico simples, implementando respostas multiescala de um RGCs simétrico ON-center e OFF-surround, pode facilmente revelar o surgimento de inclinação nesses padrões. No futuro, pretendemos estender o modelo para subunidades espaciais não lineares e / ou uma implementação de nCRF, a fim de identificar os ângulos de orientação em inclinações detectadas no mapa de borda quantitativamente ao invés de nosso estágio de análise de Hough.

A novidade deste trabalho surge de sua simplicidade e da visão de representação em múltiplas escalas, para explicar o surgimento da inclinação em Tile Illusions com base em um mapa de borda DoG do estímulo visual, no qual as escalas dos filtros são determinadas com base nas características de o padrão investigado. Mais importante, acreditamos que a explicação do mapa de borda para o efeito de inclinação e percepção visual em geral faz a ponte entre a filtragem multiescala de baixo nível com explicações de alto nível das estruturas de agrupamento perceptual da Gestalt por princípios como boa continuação e conectividade dos elementos do padrão. Além disso, devemos afirmar aqui que mudanças graduais nas escalas DoG tornam o modelo mais plausível biologicamente, e mudanças abruptas como dobrar a escala em cada nível podem acabar perdendo algumas informações importantes, para modelar ferramentas CV em geral e abordar ilusões de inclinação.


2. Experimento 1: OFRs para grades compostas por tiras horizontais de contra-fase de altura variável

2.1. Material e métodos

A maioria das técnicas eram muito semelhantes às utilizadas anteriormente em nosso laboratório (Sheliga, Chen, FitzGibbon & # x00026 Miles, 2005, Sheliga, Quaia, Cumming & # x00026 Fitzgibbon, 2012) e, portanto, serão apenas descritas brevemente aqui . Os protocolos experimentais foram aprovados pelo Comitê de Revisão Institucional preocupado com o uso de seres humanos.

2.1.1. assuntos

Três sujeitos participaram deste estudo: dois eram autores (BMS e EJF) e o terceiro era um voluntário remunerado que desconhecia a finalidade dos experimentos (AGB). Todos os indivíduos tinham visão normal ou corrigida para normal. A visão era binocular.

2.1.2. Gravação de movimento ocular

As posições horizontal e vertical de um olho (olho direito em BMS e EJF olho esquerdo em AGB) foram registradas com uma técnica de indução eletromagnética (Robinson, 1963) usando uma bobina de busca escleral embutida em um anel de silastina (Collewijn, Van Der Mark & ​​# x00026 Jansen, 1975), conforme descrito por Yang, FitzGibbon, & # x00026 Miles (2003).

2.1.3. Exibição visual e os estímulos de grade

Os sujeitos sentaram-se em uma sala escura com as cabeças posicionadas por meio de apoios ajustáveis ​​(para a testa e queixo) e presas com uma faixa para a cabeça. Os estímulos visuais foram apresentados em um monitor CRT 21 & # x02033 localizado em frente a 45,7 cm do vértice da córnea. A tela do monitor tinha 400 mm de largura e 300 mm de altura, com uma resolução de 1024 & # x000d7 768 pixels (20,55 pixels / & # x000b0, diretamente à frente dos olhos), uma taxa de atualização vertical de 160 Hz e uma luminância média de 20,8 cd / m 2. Os sinais RGB da placa de vídeo forneciam as entradas para um atenuador (Pelli, 1997) cuja saída era conectada às entradas RGB do monitor por meio de um divisor de sinal de vídeo (Black Box Corp., AC085A-R2). Este arranjo permitiu a apresentação de imagens em preto e branco com resolução em tons de cinza de 11 bits.

Os estímulos visuais consistiram em grades verticais 1-D com perfis de luminância sinusoidal (0,25 cpd 32% de contraste) que estendeu a largura total da tela (47 & # x000b0) e passou por sucessivos deslocamentos de comprimento de onda & # x0215b a cada quadro de vídeo (20 Hz temporal frequência). As grades eram

25 & # x000b0 de altura e centralizado verticalmente no nível dos olhos do sujeito & # x02019s. Em qualquer ensaio, as grades eram compostas por um número variável (de 1 a 128) de tiras horizontais adjacentes de igual altura, de modo que as tiras vizinhas estavam sempre em contra-fase (180 & # x000b0 diferença de fase). A altura de uma tira pode variar de

25 e # x000b0 512 pixels) o comprimento de onda da grade em incrementos de oitava. Consulte a Figura 1A e # x02013C para exemplos. Cada bloco de tentativas teve 16 estímulos intercalados aleatoriamente: 8 alturas de faixa e 2 direções de movimento (para a esquerda vs. para a direita).

2.1.4. Procedimentos

Todos os aspectos dos paradigmas experimentais eram controlados por dois PCs, que se comunicavam via Ethernet usando o protocolo TCP / IP. Um dos PCs estava executando um pacote de software de experiência em tempo real (REX) desenvolvido por Hays, Richmond e Optican (1982), e fornecia o controle geral do protocolo experimental, bem como adquirir, exibir e armazenar os dados de movimento dos olhos . O outro PC estava executando sub-rotinas Matlab, utilizando as extensões Psychophysics Toolbox (Brainard, 1997, Pelli, 1997), e gerou os estímulos visuais.

No início de cada tentativa, os padrões de grade apareceram (selecionados aleatoriamente de uma tabela de pesquisa) junto com um ponto-alvo (diâmetro, 0,25 & # x000b0) no centro da tela que o sujeito foi instruído a fixar. Depois que o olho do sujeito & # x02019s foi posicionado dentro de 2 & # x000b0 do alvo de fixação e nenhuma sacada foi detectada (usando um limiar de velocidade do olho de 18 & # x000b0 / s) por um período aleatório de 600 a 1100 ms, o alvo de fixação desapareceu e movimento começou. O movimento durou 200 ms, ponto em que a tela ficou cinza uniforme (luminância, 20,8 cd / m 2) marcando o fim do ensaio. Após um intervalo entre tentativas de 500 ms, um novo padrão de grade apareceu junto com um alvo de fixação central, iniciando uma nova tentativa. Os sujeitos foram solicitados a evitar piscar ou mudar a fixação, exceto durante os intervalos entre as tentativas, mas não receberam instruções relacionadas aos estímulos de movimento. Se nenhuma sacada fosse detectada durante o ensaio, os dados eram armazenados em disco, caso contrário, o ensaio era abortado e subsequentemente repetido no mesmo bloco. Os dados foram coletados ao longo de várias sessões até que cada condição fosse repetida um número adequado de vezes para permitir uma boa resolução das respostas (por meio do cálculo da média).

2.1.5. Análise de dados

Os dados de posição horizontal e vertical dos olhos obtidos durante o procedimento de calibração foram, cada um, ajustados com polinômios de segunda ordem que foram usados ​​para linearizar os dados de posição horizontal e vertical dos olhos registrados durante o experimento propriamente dito. Os sinais linearizados da posição do olho foram suavizados com um filtro Butterworth de 6ª ordem causal (3 dB a 30 Hz) e os perfis temporais médios foram calculados para cada condição de estímulo. Os ensaios com intrusões sacádicas (que não conseguiram atingir o corte de velocidade do olho de 18 & # x000b0 / s usados ​​durante o experimento) foram excluídos. Como os OFRs eliciados por alguns estímulos podem ser muito fracos e / ou mostrar assimetrias direcionais (por exemplo, Quaia, Sheliga, Fitzgibbon & # x00026 Optican, 2012), a posição horizontal média do olho com cada estímulo de movimento para a esquerda foi subtraída do olho horizontal médio posição com o estímulo de movimento para a direita correspondente: a & # x0201 cmeana posição do olho RL & # x0201d. As respostas de velocidade (a & # x0201cmean R-L da velocidade do olho & # x0201d) foram estimadas a partir de diferenças entre amostras com 10ms de distância (método da diferença central) e avaliadas a cada 1ms. A latência de resposta foi estimada determinando o tempo após o início do estímulo quando a velocidade média do olho R-L primeiro excedeu 0,1 & # x000b0 / s. Os OFRs iniciais para um determinado estímulo foram quantificados medindo as mudanças nos sinais de posição do olho R-L médios & # x02014 & # x0201cOFR amplitude & # x0201d & # x02014 ao longo do período inicial de malha aberta, isto é, ao longo do período até duas vezes a latência de resposta mínima. Para todos os dados de um determinado sujeito, a janela de medição sempre começou ao mesmo tempo após o início do estímulo (& # x0201cestímulo bloqueado & # x0201d), o tempo real sendo determinado pela menor latência de resposta. o duração da janela para um determinado assunto era o mesmo em todas as condições experimentais.

2.2. Resultados

A Figura 2A mostra os perfis médios de velocidade do olho R-L ao longo do tempo obtidos a partir do sujeito BMS em resposta a estímulos de diferentes alturas de tira (notado por codificação em escala de cinza de traços de velocidade). Os OFRs aumentaram para alturas de tiras de até 2 & # x020133 & # x000b0, enquanto o aumento adicional da altura levou a um declínio significativo na magnitude do OFR. Além disso, conforme a altura da faixa ficava maior, a latência do OFR diminuía até atingir um platô para alturas de faixa de 2 & # x020133 & # x000b0 ou mais. As Figuras 2B e 2C quantificam essas observações para três sujeitos.

OFRs para estímulos de diferentes alturas de tira. (UMA) Perfis de velocidade média do olho R-L ao longo do tempo para o sujeito BMS. Diferentes alturas de faixa são codificadas em escala de cinza (consulte o encarte). Abscissa mostra o tempo desde o início do estímulo. As linhas pontilhadas horizontais representam a velocidade zero. A linha preta espessa horizontal abaixo dos traços indica a janela de medição de resposta. Cada traço é a resposta média a 133 & # x02013140 repetições do estímulo. (B) Amplitude OFR: Dependência da altura da tira para os sujeitos AGB (diamantes vermelhos, 129 & # x02013141 ensaios por condição SDs variaram 0,010 & # x020130,024 & # x000b0), BMS (círculos pretos preenchidos, 133 & # x02013140 ensaios por condição SDs variaram de 0,010 & # x020130.021 & # x000b0) e EJF (quadrados preenchidos em azul, 58 & # x0201371 tentativas por SDs de condição variaram de 0,013 & # x020130.027 & # x000b0). (C) Latência OFR: Dependência da altura da tira para os sujeitos AGB, BMS e EJF. Cores e símbolos como em B.

2.2.1. Um modelo simples: RFs centro / surround antagônicos

Para avaliar o papel dos primeiros neurônios visuais na geração de nossas respostas, tentamos modelar as respostas quantitativamente com um modelo Linear-Não Linear (LN) simples. Esses modelos, consistindo em um filtro linear seguido por uma não linearidade de saída (normalmente um expoente), foram amplamente usados ​​para descrever a resposta de neurônios na retina, LGN e córtex estriado. Primeiro, tentamos descrever as respostas com filtros lineares que se assemelham a RFs de células ganglionares da retina. Para isso, usamos uma diferença de duas funções gaussianas 2-D (Enroth-Cugell & # x00026 Robson, 1966, Rodieck, 1965): Modelo de diferença de gaussianas (DOG Figura 3A):

Modelando os OFRs. (A & # x02013C) modelo de RF centro / surround antagônico. (C& # x02013D) Modelo RF V1 (Gabor). (UMA) Diferença da função Gaussiana (DOG). o & # x0201con & # x0201d-center de um filtro é uma área onde a função DOG permanece positiva. (B) Potência de resposta normalizada de filtros 2D circulares antagonistas de centro / surround de diâmetros de & # x0201con & # x0201d-center diferentes para estímulos de diferentes alturas de faixa (escala de cinza codificada, ver inserção). A potência é normalizada pela resposta máxima à grade de uma faixa. (C) Dependência da potência normalizada sobre a altura da faixa de estímulo: o estímulo com potência absoluta máxima foi configurado para ter uma potência de 1. Linha preta contínua: modelo DOG Experimento 1. Linha contínua cinza: filtros Gabor Experimento 1. Linha preta pontilhada: DOG Experimento de configuração de contrafase modelo 3. Linha tracejada preta: Experimento de configuração de lacuna modelo DOG 3. (D) Potência normalizada dos filtros Gabor de diferentes frequências espaciais centrais para estímulos de diferentes alturas de faixa (escala de cinza codificada, ver inserção). A potência é normalizada pela resposta máxima à grade de uma faixa. Veja o texto para detalhes.

Definimos o & # x0201con & # x0201d-center de um filtro como a área onde a função DOG permanece positiva (Figura 3A). Atribuição de desvios padrão iguais (SDs) aos envelopes gaussianos horizontais e verticais (& # x003c3Cx = & # x003c3Cy e & # x003c3Sx = & # x003c3Sy) resultaria em filtros circulares, enquanto SDs gaussianos não iguais em duas dimensões cardinais resultariam em filtros elípticos. O SD do envelope gaussiano circundante foi sempre cinco vezes maior do que o centro (& # x003c3Sx = 5& # x003c3Cx e & # x003c3Sy = 5& # x003c3Cy), que corresponde ao valor médio da razão de diâmetro de RF clássico centro / circundante encontrada para células M de gânglio de primata (

4.8 Croner & # x00026 Kaplan, 1995). 1 Razões de diâmetro centro / circundante semelhantes foram relatadas para células X felinas (Cleland, Levick & # x00026 Sanderson, 1973, Linsenmeier, Frishman, Jakiela & # x00026 Enroth-Cugell, 1982). O volume sob a superfície gaussiana 2-D central foi ajustado para o dobro do volume gaussiano circundante (UMAC & # x02248 50UMAS na Equação 1), novamente de acordo com os valores relatados para células ganglionares de primatas (Croner & # x00026 Kaplan, 1995).

Uma grade de onda senoidal de certa frequência espacial ativaria filtros com uma variedade de tamanhos. A resposta do filtro depende da frequência espacial e do tamanho da faixa de uma forma que torna necessário considerar uma variedade de tamanhos de filtro na contabilização da resposta a qualquer estímulo. Para estimar a resposta de uma população de filtros em uma escala, nós convolvemos cada um dos nossos oito estímulos com este filtro e, em seguida, tomamos a soma dos quadrados da convolução (poder do filtro) Antes de combinar os filtros, ajustamos o fato de que os OFRs exibem uma dependência de passagem de banda na frequência espacial (Quaia et al., 2012, Sheliga et al., 2005), dimensionando o valor da potência do filtro em cada canal de acordo com o observado sintonização de frequência espacial: consulte o Apêndice para obter detalhes. A Figura 3B mostra essas respostas do modelo em escala para filtros circulares de diferentes tamanhos para cada um dos estímulos que usamos. Conforme a altura da faixa fica menor, há um deslocamento progressivo do pico para a esquerda. Para avaliar o saída total do filtro para um determinado estímulo, somamos a potência de 121 filtros cujos diâmetros & # x0201con & # x0201d-centro foram espaçados por 1/16 da oitava e variaram de 2,6 min de arco a 7,9 & # x000b0: 2, isso é equivalente a calcular o área sob a curva para cada traço na Figura 3B. A linha preta contínua na Figura 3C mostra a dependência de tal saída de filtro total na altura da tira. Uma característica dos dados empíricos não é capturada simplesmente pela resposta do filtro: em tamanhos de faixa grandes, os OFRs eram realmente menores do que no tamanho de faixa ideal (consulte a Figura 2B). Para acomodar esse recurso, incluímos um termo de normalização que dependia da altura da faixa. Para qualquer filtro, ajustamos as amplitudes OFR com a seguinte equação:

onde R é a amplitude de OFR, SH é a altura da faixa 3, P é a saída total do filtro e UMA, K, e B são parâmetros livres. O termo P UMA * K representa a resposta dos filtros LN que se assemelham às células ganglionares da retina. Os termos K e UMA determinar as magnitudes de resposta de pico e a taxa de aumento com a altura da faixa, respectivamente. Escolhemos o termo 1 + B* SH para descrever a atenuação para tamanhos de faixa grandes por sua simplicidade: ele apresenta apenas um parâmetro livre, B, que determina a extensão da supressão por grandes tamanhos de tiras.

A Equação 2 forneceu bons ajustes para as dependências de OFR na altura da tira. Quando os filtros eram circulares, os coeficientes de determinação (r 2 ) da Equação 2 os ajustes foram iguais a 0,965, 0,967 e 0,927 para os sujeitos AGB, BMS e EJF, respectivamente. Esses ajustes são mostrados por linhas pretas contínuas na Figura 4A e # x02013C. Filtros & # x02019 razões de elipticidade (altura / largura) tiveram efeitos menores na qualidade dos ajustes: mudanças de quatro vezes na proporção & # x02014 de 0,5 para 2 & # x02014 menor r 2 valores de 3 & # x020136% em diferentes disciplinas. Para garantir que este resultado não fosse sensível ao nosso modelo simples de normalização, usamos um modelo sem normalização (configuração B a zero na equação 2), e ajuste isso apenas aos dados para alturas de faixa até e incluindo o máximo (& # x0003c1 ciclo do período de grade, consulte a Figura 4). Esses ajustes também eram extremamente bons - r 2 igualou 0,966, 0,976 e 0,931 para os sujeitos AGB, BMS e EJF, respectivamente. Finalmente, discutimos abaixo um modelo diferente (Razão de Gaussianas ROG) para explicar o declínio da resposta em grandes alturas de faixa.

A Equação 2 se ajusta para os dados de amplitude OFR do Experimento 1. A dependência da amplitude OFR na altura da tira & # x02014 círculos preenchidos em preto & # x02014 é representada novamente a partir da Figura 2B. Linhas pretas contínuas: ajustes obtidos usando filtros 2D circulares antagônicos centro / surround. Linhas pontilhadas pretas: ajustes obtidos com os filtros Gabor. Linhas contínuas cinza: modelo ROG se encaixa (ver texto). (UMA) sujeito AGB, (B) assunto BMS, (C) assunto EJF.

2.2.2. Um modelo simples: RFs de célula simples V1

Usamos funções de Gabor 2-D para modelar propriedades espaciais de células simples do córtex estriado & # x02019 RFs (Jones & # x00026 Palmer, 1987, Ringach, 2002):

Para cada frequência, usamos cinco envelopes gaussianos diferentes, com SDs horizontais (& # x003c3x largura) de 0,1, 0,2, 0,3, 0,4 ou 0,5 vezes o comprimento de onda central Gabor (cobrindo

93% do nx valores em Ringach, amostra neuronal de 2002). O SD Gaussiano vertical (& # x003c3y altura) para cada filtro foi definido como 1,07 vezes & # x003c3x (valor mediano de ny/ nx razão em Ringach, 2002). Tal como acontece com o modelo DOG acima, as saídas do filtro em cada escala foram normalizadas para produzir a sintonia de frequência espacial observada para faixas únicas. Traços individuais na Figura 3D mostram a potência normalizada dos filtros Gabor de diferentes frequências espaciais centrais para estímulos de diferentes alturas de faixa. Cada ponto nessas curvas é a resposta somada dos cinco filtros com diferentes & # x003c3x. Para estímulos de altura de faixa inferior, os máximos de potência foram deslocados para a direita. Para avaliar o saída total do filtro para um determinado estímulo, somamos a potência de 89 filtros cujas frequências espaciais centrais foram espaçadas por 1/16 da oitava e variaram de 0,0625 cpg a 2,8 cpg: isso é equivalente a calcular a área sob a curva para cada traço na Figura 3D . A linha contínua cinza na Figura 3C mostra a dependência de tal saída de filtro total na altura da tira.

A Equação 2 forneceu bons ajustes para as dependências de OFR na altura da tira: o r 2 s igualou 0,920, 0,909 e 0,854 para os sujeitos AGB, BMS e EJF, respectivamente. Esses ajustes são mostrados por linhas pretas pontilhadas na Figura 4A e # x02013C. A qualidade dos ajustes melhoraria ainda mais se fôssemos usar apenas os filtros cujo & # x003c3x igualou 0,1 (ou 0,2): o r 2 s alcançaria 0,969 (ou 0,964), 0,963 (ou 0,957) e 0,920 (ou 0,910) para os sujeitos AGB, BMS e EJF, respectivamente.

2.3. Discussão do Experimento 1

O objetivo principal deste experimento foi avaliar o impacto de filtros neuronais centro / surround antagonistas na via retinogênica em RLOs. Um modelo que simplesmente soma as respostas dos filtros central / surround e inclui a normalização divisiva reproduziu as magnitudes de OFR para um grande conjunto de estímulos visuais. Esse resultado não implica que o processamento cortical não tenha papel no RLO. Em vez disso, para esse estímulo específico, a resposta crescente com o aumento da altura da tira é amplamente explicada pelo efeito desse estímulo na retina. Na verdade, o estímulo foi construído com esse objetivo em mente. Se as tiras forem pequenas o suficiente, então, ter tiras adjacentes em contra-fase pode silenciar as células ganglionares da retina. Mostramos que os resultados também são compatíveis com filtros típicos de células corticais simples. Mas, uma vez que esses filtros lineares podem ser construídos a partir dos filtros DOG que usamos para modelar o processamento da retina, e os filtros DOG reproduzem os mesmos resultados, parece provável que seja a filtragem da retina que produz esse efeito. Isso sugere que esse estímulo nos permite observar as propriedades da RLO que refletem o processamento retinal.

A evidência eletrofisiológica existente indica que os centros de RF elípticos & # x02014 significam razões de eixo menor / maior de 0,7 & # x020130,8 & # x02014 são frequentemente observados em células ganglionares da retina de gatos (Hammond, 1974, Levick & # x00026 Thibos, 1982, Soodak, Shapley & # x00026 Kaplan, 1987) e primatas (Passaglia, Troy, Ruttiger & # x00026 Lee, 2002), bem como no primata LGN (Kremers & # x00026 Weiss, 1997, Smith, Chino, Ridder, Kitagawa & # x00026 Langston, 1990). Nosso modelo, entretanto, não parece ser particularmente sensível a esse aspecto das propriedades de RF da retina e acomoda facilmente o fato de que as formas de RF da grande maioria dos neurônios na retina se desviam da circularidade.

Para obter bons ajustes para todo o conjunto de dados de amplitude OFR, tivemos que introduzir um termo adicional na equação de ajuste & # x02014 1 + B ∗ SH & # x02014 que seria responsável por um declínio considerável (até 18 & # x0201325%) na amplitude de OFR observada em grandes alturas de faixa. Uma observação um tanto semelhante foi feita em um de nossos estudos anteriores (Sheliga, FitzGibbon & # x00026 Miles, 2008): os OFRs para estímulos de tela inteira eram geralmente marcadamente mais fracos do que os OFRs para estímulos com uma extensão horizontal e vertical idêntica, mas compostos por 15 faixas separadas por intervalos de luminância média. No artigo atual, no entanto, podemos dar um passo adiante e mostrar que a força de inibição é uma função simples da altura da tira. O substrato neural deste efeito & # x0201 inibitório & # x0201d é provavelmente cortical, talvez através dos neurônios terminais no córtex estriado (Hubel & # x00026 Wiesel, 1965) e / ou os mecanismos inibitórios circundantes locais na área MT (Born & # x00026 Bradley, 2005). Uma possibilidade interessante em relação à supressão vem de estudos que mostraram a existência de mecanismos supressivos surround em neurônios V1 (Cavanaugh, Bair & # x00026 Movshon, 2002a, Sceniak, Ringach, Hawken & # x00026 Shapley, 1999). Observações semelhantes também foram feitas no nível LGN (campo receptivo extra-clássico de Solomon, White & # x00026 Martin, 2002). O modelo da Razão de Gaussianos (ROG: Cavanaugh et al., 2002a) foi muito bem-sucedido na descrição da ascensão e queda na atividade de unidades individuais em resposta a sinusóides de diferentes tamanhos à deriva. Portanto, testamos este modelo com nosso conjunto de dados OFR. Definimos a proporção dos envelopes gaussianos 2D & # x0201csurround & # x0201d vs. & # x0201ccentral & # x0201d gaussianos em 3: 1, de acordo com os valores derivados da célula única (Cavanaugh et al., 2002a), bem como do psicofísico (Nurminen , Kilpelainen, Laurinen & # x00026 Vanni, 2009) studies. Ajustamos as amplitudes de OFR com a seguinte equação (após Cavanaugh et al., 2002a):

onde R é a amplitude OFR, eu 2 C é a soma dos quadrados da convolução com o ROG & # x0201c Gaussiano central & # x0201d, eu 2 S é a soma dos quadrados da convolução com o ROG & # x0201csurround Gaussiano & # x0201d A, K, e kS são parâmetros livres. UMA e K determinar a magnitude da resposta de pico e a taxa de aumento com a altura da faixa, respectivamente, enquanto kS é o ganho do mecanismo surround (o ganho do mecanismo central sempre foi definido como um). Para calcular a saída ROG total, somamos a saída de 89 razões: os desvios-padrão gaussianos & # x0201d centrais variaram de 1,8 min de arco a 1,3 & # x000b0 (espaçado por 1/16 da oitava), enquanto o & # x0201corre ao redor Os desvios padrão gaussianos & # x0201d em cada proporção individual foram três vezes maiores do que o & # x0201ccentral & # x0201d um.

A Equação 4 forneceu bons ajustes para as dependências de OFR na altura da tira: o r 2 s igualou 0,944, 0,948 e 0,902 para os sujeitos AGB, BMS e EJF, respectivamente. Esses ajustes são mostrados por linhas cinza contínuas na Figura 4A e # x02013C, e os valores de melhor ajuste dos parâmetros livres estão listados na Tabela S1 do Material Suplementar. O modelo ROG localizou corretamente os máximos das dependências OFR, embora a forma do braço decrescente das dependências não correspondesse exatamente aos dados experimentais.

Embora precisemos incluir um modelo de normalização para ajustar todos os dados, nossas conclusões não dependem da escolha do modelo. É a parte crescente das respostas na Figura 4 que restringe o modelo para o filtro linear. Conseqüentemente, em experimentos subsequentes, omitimos as duas maiores alturas de faixa, que causam a maior redução de resposta.


Introdução

A percepção visual é iniciada pelas respostas de múltiplas populações de neurônios na retina, cada uma com diferentes propriedades de resposta. Embora as propriedades dos neurônios no sistema visual inicial sejam responsáveis ​​por uma série de limitações da percepção visual, nem todas as propriedades de resposta específicas de uma determinada classe de neurônios são prontamente redescobertas no nível perceptivo. Em vez disso, eles podem desaparecer em áreas visuais superiores devido à integração e outros mecanismos que facilitam uma interpretação correta de um estímulo.

Um exemplo famoso desse tipo é o problema de abertura (Hildreth e Koch, 1987 Wallach, 1935). A área onde um neurônio no sistema visual pode ser excitado por um estímulo é restringida pelas dimensões finitas de seu campo receptivo, a janela do neurônio ou abertura para o mundo exterior. Se um estímulo alongado passa por um campo receptivo, o neurônio responderá apenas ao componente de movimento ortogonal à orientação do estímulo. Esse efeito ocorre essencialmente para todas as células em estágios de processamento visual inferiores, onde os campos receptivos são pequenos e a capacidade dos neurônios individuais de codificar sem ambigüidade as propriedades do estímulo é, portanto, limitada. Por outro lado, a atividade de um subconjunto de neurônios geralmente fornece informações suficientes para resolver essas ambigüidades em níveis mais elevados. Foi demonstrado, por exemplo, que o problema da abertura é resolvido pela integração na área sensível ao movimento MT (Pack e Born, 2001).

Embora este seja apenas um exemplo, acredita-se que os efeitos de integração em grande escala estejam geralmente envolvidos na geração de percepções visuais estáveis ​​e as propriedades individuais das células sobre as quais a integração ocorre permanecem, portanto, frequentemente ocultas. Como consequência, propriedades específicas de duas correntes dominantes de processamento visual inicial, os sistemas parvo- (PC) ou magnocelular (MC), nem sempre são descobertas no nível perceptivo.

Na retina de primatas, o fluxo de PC é representado por células PC lineares sustentadas e o fluxo de MC por células MC, que mostram respostas rápidas e transitórias e soma espaço-temporal não linear (Benardete et al., 1992 Derrington e Lennie, 1984 Kaplan e Shapley, 1982, Leventhal et al., 1981, White et al., 2002). As células PC têm campos receptivos menores e uma densidade mais alta do que as células MC, e apenas as células PC têm campos receptivos de oponentes de cor. É, portanto, frequentemente hipotetizado que as células PC medeiam a visão de alta acuidade para estímulos estáticos, enquanto as células MC estão principalmente envolvidas no processamento de estímulos em movimento (Schiller e Logothetis, 1990, mas ver Lee et al., 1993). Essas duas classes de células fornecem a base para a segregação nas vias visuais ventral e dorsal, que têm sido associadas à análise de forma e movimento no córtex visual (Merigan e Maunsell, 1993).

Neste artigo, sugerimos que duas ilusões visuais, causadas por movimentos oculares fixadores, podem estar diretamente relacionadas a propriedades específicas das células ganglionares MC (GCs) retinais. Para mostrar isso, simulamos respostas de GCs lineares, sustentados (PC) e não lineares, transientes (MC) durante a estimulação com um estímulo em forma de estrela na presença de movimentos fixos dos olhos. Encontramos dois efeitos na resposta da população de células MC: um desbotamento das linhas ou fatias inteiras do estímulo e uma divisão aparente de linhas únicas. Ambos os efeitos, que não eram visíveis na população de células PC, mostram instabilidades espaço-temporais consistentes com ilusões visuais causadas por uma série de estímulos relacionados. Mostraremos como os efeitos são induzidos pelos movimentos fixadores dos olhos e podem ser explicados por propriedades específicas do sistema MC retinal. Discutiremos mais adiante que, nessas condições, a percepção visual é dominada por respostas MC, enquanto as informações no fluxo de PC que facilitam uma interpretação correta do estímulo são contornadas.


Um modelo de filtro DOG da ocorrência de bandas de Mach em descontinuidades de contraste espacial

O presente trabalho propõe um modelo unificado para explicar duas propriedades previamente relatadas da ilusão da banda de Mach. O primeiro é o fato frequentemente referenciado de que as bandas de Mach são proeminentemente visíveis em rampas, mas praticamente desaparecem em passos de intensidade. A segunda propriedade, menos estudada, por outro lado, também pode estar relacionada à primeira. Diz respeito ao fato de que a largura das faixas ilusórias de Mach parece ser uma função da inclinação da própria rampa. O modelo aqui proposto combina o modelo de diferença de Gaussianas (DOG) de inibição lateral em campos receptivos com os modelos de detecção de características, baseado em uma abordagem holística. O conceito de nitidez de descontinuidade (SOD) para o estímulo da banda de Mach foi definido e está relacionado à inclinação da rampa. É sugerido que o cálculo da SOD leva a uma mudança adaptativa no ambiente inibitório, uma noção que também tem o suporte de experimentos fisiológicos.

Esta é uma prévia do conteúdo da assinatura, acesso através de sua instituição.


Referências

Aitchison, L. e Lengyel, M. (2017). Com ou sem você: codificação preditiva e inferência bayesiana no cérebro. Curr. Opiniões Neurobiol. 46, 219 e # x2013227. doi: 10.1016 / j.conb.2017.08.010

Amit, D. J., Gutfreund, H. e Sompolinsky, H. (1985). Modelos de spin-glass de redes neurais. Phys. Rev. A Gen. Phys. 32, 1007 e # x20131018. doi: 10.1103 / physreva.32.1007

Atick, J. J. (1992). A teoria da informação poderia fornecer uma teoria ecológica do processamento sensorial? Rede 3, 213 e # x2013251. doi: 10.1088 / 0954-898x_3_2_009

Atick, J. J. e Redlich, A. N. (1992). O que a retina sabe sobre cenas naturais? Neural Comput. 4, 196 e # x2013210. doi: 10.1162 / neco.1992.4.2.196

Attneave, F. (1954). Alguns aspectos informativos da percepção visual. Psychol. Rev. 61, 183 e # x2013193. doi: 10.1037 / h0054663

Attwell, D. e Laughlin, S. B. (2001). Um orçamento de energia para sinalizar na massa cinzenta do cérebro. J. Cereb. Blood Flow Metab. 21, 1133 e # x20131145. doi: 10.1097 / 00004647-200110000-00001

Baddeley, R., Abbott, L. F., Booth, M. C., Sengpiel, F., Freeman, T., Wakeman, E. A., et al. (1997). Respostas de neurônios nos córtices visuais temporais primários e inferiores a cenas naturais. Proc. Biol. Sci. 264, 1775 e # x20131783. doi: 10.1098 / rspb.1997.0246

Baden, T., Berens, P., Franke, K., Roman Roson, M., Bethge, M. e Euler, T. (2016). A diversidade funcional das células ganglionares da retina no camundongo. Natureza 529, 345 e # x2013350. doi: 10.1038 / nature16468

Bae, J. A., Mu, S., Kim, J. S., Turner, N. L., Tartavull, I., Kemnitz, N., et al. (2018). Museu digital de células ganglionares da retina com anatomia e fisiologia densa. Célula 173, 1293 & # x20131306.e19. doi: 10.1016 / j.cell.2018.04.040

Barlow, H. B. (1961). & # x201Princípios possíveis subjacentes à transformação das mensagens sensoriais, & # x201D em Comunicação Sensorial, ed. W. A. ​​Rosenblith (Cambridge, MA: MIT Press), 217 & # x2013234.

Barlow, H. B. (2001). Redundância de redução revisitada. Rede 12, 241 e # x2013253. doi: 10.1080 / net.12.3.241.253

Barlow, H. B., Hill, R. M. e Levick, W. R. (1964). Células ganglionares retinais que respondem seletivamente à direção e velocidade do movimento da imagem no coelho. J. Physiol. 173, 377 e # x2013407. doi: 10.1113 / jphysiol.1964.sp007463

Bastos, A. M., Usrey, W. M., Adams, R. A., Mangun, G. R., Fries, P., e Friston, K. J. (2012). Microcircuitos canônicos para codificação preditiva. Neurônio 76, 695 & # x2013711. doi: 10.1016 / j.neuron.2012.10.038

Baum, L. E. (1970). Uma técnica de maximização que ocorre na análise estatística de funções probabilísticas de cadeias de Markov. Ann. Matemática. Estado. 41, 164 & # x2013171. doi: 10.1214 / aoms / 1177697196

Beck, J. M., Ma, W. J., Kiani, R., Hanks, T., Churchland, A. K., Roitman, J., et al. (2008). Códigos populacionais probabilísticos para tomada de decisão bayesiana. Neurônio 60, 1142 e # x20131152. doi: 10.1016 / j.neuron.2008.09.021

Bell, A. J. e Sejnowski, T. J. (1995). Uma abordagem de maximização de informações para separação cega e deconvolução cega. Neural Comput. 7, 1129 e # x20131159. doi: 10.1162 / neco.1995.7.6.1129

Berry, M. J. II, Lebois, F., Ziskind, A., e da Silveira, R. A. (2019). A diversidade funcional na retina melhora o código da população. Neural Comput. 31, 270 e # x2013311. doi: 10.1162 / neco_a_01158

Berry, M. J. II, Warland, D. K. e Meister, M. (1997). A estrutura e a precisão dos trens de espinhos da retina. Proc. Nat. Acad. Sci. EUA. 94, 5411 e # x20135416. doi: 10.1073 / pnas.94.10.5411

Bethe, H. A. (1935). Teoria estatística de superredes. Proc. Roy. Soc. Lond. UMA 150, 552 e # x2013575. doi: 10.1098 / rspa.1935.0122

Bialek, W., Nemenman, I. e Tishby, N. (2001). Previsibilidade, complexidade e aprendizado. Neural Comput. 13, 2409 e # x20132463. doi: 10.1162 / 089976601753195969

Blattler, F. e Hahnloser, R. H. (2011). Uma hipótese de codificação eficiente liga a esparsidade e a seletividade das respostas neurais. PLoS ONE 6: e25506. doi: 10.1371 / journal.pone.0025506

Borghuis, B. G., Ratliff, C. P., Smith, R. G., Sterling, P. e Balasubramanian, V. (2008). Desenho de uma matriz neuronal. J. Neurosci. 28, 3178 & # x20133189. doi: 10.1523 / JNEUROSCI.5259-07.2008

Brivanlou, I. H., Warland, D. K. e Meister, M. (1998). Mecanismos de disparo coordenado entre as células ganglionares da retina. Neurônio 20, 527 e # x2013539. doi: 10.1016 / s0896-6273 (00) 80992-7

Buckley, C. L. e Toyoizumi, T. (2018). Uma teoria de como o comportamento ativo estabiliza a atividade neural: modulação de ganho neural por feedback ambiental de circuito fechado. PLoS Comput. Biol. 14: e1005926. doi: 10.1371 / journal.pcbi.1005926

Butts, D. A., Weng, C., Jin, J., Yeh, C. I., Lesica, N. A., Alonso, J. M., et al. (2007). Precisão temporal no código neural e as escalas de tempo da visão natural. Natureza 449, 92 e # x201395. doi: 10.1038 / nature06105

Buzsaki, G. (2010). Sintaxe neural: assemblies de células, synapsembles e leitores. Neurônio 68, 362 e # x2013385. doi: 10.1016 / j.neuron.2010.09.023

Buzsaki, G. e Mizuseki, K. (2014). O cérebro log-dinâmico: como as distribuições distorcidas afetam as operações de rede. Nat. Rev. Neurosci. 15, 264 & # x2013278. doi: 10.1038 / nrn3687

Catellana, M. e Bialek, W. (2014). Vidro de spin inverso e problemas de entropia máxima relacionados. Phys. Rev. Lett. 113:117204.

Chalk, M., Marre, O. e Tka & # x010Dik, G. (2018). Rumo a uma teoria unificada de codificação eficiente, preditiva e esparsa. Proc. Natl. Acad. Sci. EUA. 115, 186 & # x2013191. doi: 10.1073 / pnas.1711114115

Chen, E.Y., Chou, J., Park, J., Schwartz, G., e Berry, M. J. II (2014). Os mecanismos do circuito neural subjacentes à resposta retiniana à reversão de movimento. J. Neurosci. 34, 15557 e # x201315575. doi: 10.1523 / JNEUROSCI.1460-13.2014

Chen, E. Y., Marre, O., Fisher, C., Schwartz, G., Levy, J., da Silveira, R. A., et al. (2013). Resposta de alerta ao início do movimento na retina. J. Neurosci. 33, 120 e # x2013132. doi: 10.1523 / JNEUROSCI.3749-12.2013

Cohen, M. R. e Kohn, A. (2011). Medir e interpretar correlações neuronais. Nat. Neurosci. 14, 811 e # x2013819. doi: 10.1038 / nn.2842

da Silveira, R. A., e Berry, M. J. II (2014). Codificação de alta fidelidade com neurônios correlacionados. PLoS Comput. Biol. 10: e1003970. doi: 10.1371 / journal.pcbi.1003970

Dacey, D. M., Peterson, B. B., Robinson, F. R. e Gamlin, P. D. (2003). Fogos de artifício na retina de primatas: a fotodinâmica in vitro revela diversos tipos de células ganglionares que projetam LGN. Neurônio 37, 15 e # x201327. doi: 10.1016 / s0896-6273 (02) 01143-1

Dan, Y., Atick, J. J. e Reid, R. C. (1996). Codificação eficiente de cenas naturais no núcleo geniculado lateral: teste experimental de uma teoria computacional. J. Neurosci. 16, 3351 & # x20133362. doi: 10.1523 / jneurosci.16-10-03351.1996

DeVries, S. H. (1999). Disparo correlacionado em células ganglionares retinais de coelho. J. Neurophysiol. 81, 908 e # x2013920. doi: 10.1152 / jn.1999.81.2.908

Dhande, O. S., Stafford, B. K., Lim, J. A. e Huberman, A. D. (2015). Contribuições das células ganglionares da retina para o processamento visual subcortical e comportamentos. Annu. Rev. Vis. Sci. 1, 291 e # x2013328. doi: 10.1146 / annurev-vision-082114-035502

Diamond, M. E., Petersen, R. S., Harris, J. A. e Panzeri, S. (2003). Investigações sobre a organização da informação no córtex sensorial. J. Physiol. Paris 97, 529 e # x2013536. doi: 10.1016 / j.jphysparis.2004.01.010

Ecker, A. S., Berens, P., Keliris, G. A., Bethge, M., Logothetis, N. K., e Tolias, A. S. (2010). Disparo neuronal descorrelacionado em microcircuitos corticais. Ciência 327, 584 & # x2013587. doi: 10.1126 / science.1179867

Franke, F., Fiscella, M., Sevelev, M., Roska, B., Hierlemann, A., e da Silveira, R. A. (2016). Estruturas de correlação neural e como elas favorecem a codificação. Neurônio 89, 409 e # x2013422. doi: 10.1016 / j.neuron.2015.12.037

Ganmor, E., Segev, R. e Schneidman, E. (2011). A arquitetura das redes de interação funcional na retina. J. Neurosci. 31, 3044 e # x20133054. doi: 10.1523 / JNEUROSCI.3682-10.2011

Ganmor, E., Segev, R. e Schneidman, E. (2015). Um dicionário de sinônimos para um código de população neural. Elife 4: e06134. doi: 10.7554 / eLife.06134

Gao, P. e Ganguli, S. (2015). Sobre simplicidade e complexidade no admirável mundo novo da neurociência em larga escala. Curr. Opiniões Neurobiol. 32, 148 e # x2013155. doi: 10.1016 / j.conb.2015.04.003

Gjorgjieva, J., Sompolinsky, H. e Meister, M. (2014). Benefícios da divisão da via na codificação sensorial. J. Neurosci. 34, 12127 e # x201312144. doi: 10.1523 / JNEUROSCI.1032-14.2014

Hahn, G., Ponce-Alvarez, A., Monier, C., Benvenuti, G., Kumar, A., Chavane, F., et al. (2017). A atividade cortical espontânea está temporariamente posicionada perto da criticidade. PLoS Comput. Biol. 13: e1005543. doi: 10.1371 / journal.pcbi.1005543

Hansen, B. J., Chelaru, M. I. e Dragoi, V. (2012). Variabilidade correlacionada em circuitos corticais laminares. Neurônio 76, 590 e # x2013602. doi: 10.1016 / j.neuron.2012.08.029

Hebb, D. O. (1949). A Organização do Comportamento: Uma Teoria Neuropsicológica. New York, NY: Wiley.

Hosoya, T., Baccus, S. A. e Meister, M. (2005). Codificação preditiva dinâmica pela retina. Natureza 436, 71 e # x201377. doi: 10.1038 / nature03689

Huang, H. e Toyoizumi, T. (2016). Agrupamento de palavras de código neural revelado por uma transição de fase de primeira ordem. Phys. Rev. E 93: 062416. doi: 10.1103 / PhysRevE.93.062416

Hubel, D. H. (1995). Olho, cérebro e visão. New York, NY: W.H. Freeman.

Hubel, D. H. e Wiesel, T. N. (1962). Campos receptivos, interação binocular e arquitetura funcional no córtex visual do gato & # x2019s. J. Physiol. 160, 106 e # x2013154. doi: 10.1113 / jphysiol.1962.sp006837

Humplik, J. e Tka & # x010Dik, G. (2017). Modelos probabilísticos para populações neurais que capturam naturalmente acoplamento global e criticidade. PLoS Comput. Biol. 13: e1005763. doi: 10.1371 / journal.pcbi.1005763

Hyv & # x00E4rinen, A., Hurri, J. e Hoyer, P. O. (2009). Estatística de imagem natural: uma abordagem probabilística para a visão computacional inicial. Londres: Springer-Verlag.

Ioffe, M. L. e Berry, M. J. II (2017). A fase estruturada de & # x2018 temperatura baixa & # x2019 do código de população da retina. PLoS Comput. Biol. 13: e1005792. doi: 10.1371 / journal.pcbi.1005792

Josic, K., Shea-Brown, E., Doiron, B., e de la Rocha, J. (2009). Correlações dependentes de estímulo e códigos de população. Neural Comput. 21, 2774 & # x20132804. doi: 10.1162 / neco.2009.10-08-879

Kara, P., Reinagel, P. e Reid, R. C. (2000). Baixa variabilidade de resposta em neurônios retinais, talâmicos e corticais registrados simultaneamente. Neurônio 27, 635 e # x2013646. doi: 10.1016 / s0896-6273 (00) 00072-6

Kohn, A., Coen-Cagli, R., Kanitscheider, I., e Pouget, A. (2016). Correlações e informação da população neuronal. Annu. Rev. Neurosci. 39, 237 e # x2013256. doi: 10.1146 / annurev-neuro-070815-013851

Koster, U., Sohl-Dickstein, J., Gray, C. M. e Olshausen, B. A. (2014). Modelando correlações de ordem superior em microcolunas corticais. PLoS Comput. Biol. 10: e1003684. doi: 10.1371 / journal.pcbi.1003684

Lankarany, M., Al-Basha, D., Ratte, S., e Prescott, S. A. (2019). O spiking sincronizado diferencialmente permite a codificação neural multiplexada. Proc. Natl. Acad. Sci. EUA. 116, 10097 e # x201310102. doi: 10.1073 / pnas.1812171116

Lennie, P. (2003). O custo da computação cortical. Curr. Biol. 13, 493 e # x2013497. doi: 10.1016 / s0960-9822 (03) 00135-0

Lewicki, M. S. (2002). Codificação eficiente de sons naturais. Nat. Neurosci. 5, 356 e # x2013363. doi: 10.1038 / nn831

Li, Q. A., Hernandez, O., Schnitzer, M. S., e Berry, M. J. II (2019). A atividade populacional no córtex visual primário é organizada em grupos bem definidos. Washington, DC: Society for Neuroscience.

Linsker, R. (1988). Auto-organização em uma rede perceptual. Computador 21, 105 e # x2013117. doi: 10.1109 / 2.36

Loback, A. R. e Berry, M. J. II (2018). Um mecanismo biologicamente plausível para aprender grupos de atividade neural. bioRxiv [Pré-impressão]. doi: 10.1101 / 389155

Loback, A. R., Prentice, J. S., Ioffe, M. L. e Berry, M. J. II (2017). Os modos robustos de ruído do código de população da retina têm a geometria de & # x201Cridges & # x201D e correspondem a comunidades neuronais. Neural Comput. 29, 3119 e # x20133180. doi: 10.1162 / neco_a_01011

Lundstrom, B. N. e Fairhall, A. L. (2006). Decodificar a variância do estímulo a partir de um código neural distributivo de intervalos entre os picos. J. Neurosci. 26, 9030 e # x20139037. doi: 10.1523 / JNEUROSCI.0225-06.2006

Ma, W. J., Beck, J. M., Latham, P. E. e Pouget, A. (2006). Inferência bayesiana com códigos populacionais probabilísticos. Nat. Neurosci. 9, 1432 e # x20131438. doi: 10.1038 / nn1790

Maoz, O., e Schneidman, E. (2017). maxent_toolbox: Caixa de ferramentas de entropia máxima para MATLAB. 1.0.2. Disponível em: https://orimaoz.github.io/maxent_toolbox/.

Maoz, O., Tka & # x010Dik, G., Esteki, M. S., Kiani, R. e Schneidman, E. (2018). Aprendizagem de representações probabilísticas com circuitos neurais conectados aleatoriamente. bioRxiv [Pré-impressão]. doi: 10.1101 / 478545

Masland, R. H. (2012). A organização neuronal da retina. Neurônio 76, 266 e # x2013280. doi: 10.1016 / j.neuron.2012.10.002

Mastronarde, D. N. (1989). Disparo correlacionado de células ganglionares da retina. Trends Neurosci. 12, 75 e # x201380. doi: 10.1016 / 0166-2236 (89) 90140-9

McIntosh, L. T., Maheswaranathan, N., Nayebi, A., Ganguli, S., e Baccus, S. A. (2016). Modelos de aprendizado profundo da resposta da retina a cenas naturais. Adv. Neural Inf. Processo. Syst. 29, 1369 e # x20131377.

McKay, D. J. C. (2003). Teoria da informação, inferência e algoritmos de aprendizagem. Cambridge: Cambridge University Press.

Meister, M. e Berry, M. J. II (1999). O código neural da retina. Neurônio 22, 435 e # x2013450. doi: 10.1016 / s0896-6273 (00) 80700-x

Mezard, M. e Montanari, A. (2009). Informação, Física e Computação. Oxford: Oxford University Press.

Mezard, M., Parisi, G. e Virasoro, M. (1987). Teoria do Spin Glass e além: Uma introdução ao método da réplica e suas aplicações. Singapura: Publicação Científica Mundial.

Mora, T. e Bialek, W. (2011). Os sistemas biológicos estão preparados para a criticidade? J. Stat. Phys. 144, 268 e # x2013302. doi: 10.1007 / s10955-011-0229-4

Mora, T., Deny, S. e Marre, O. (2015). Criticidade dinâmica na atividade coletiva de uma população de neurônios da retina. Phys. Rev. Lett. 114: 078105. doi: 10.1103 / PhysRevLett.114.078105

Moreno-Bote, R., Beck, J., Kanitscheider, I., Pitkow, X., Latham, P., e Pouget, A. (2014). Correlações de limitação de informação. Nat. Neurosci. 17, 1410 e # x20131417. doi: 10.1038 / nn.3807

Mumford, D. (1992). Sobre a arquitetura computacional do neocórtex. II. O papel das alças cortico-corticais. Biol. Cybern. 66, 241 e # x2013251. doi: 10.1007 / bf00198477

Narayanan, N. S., Kimchi, E. Y. e Laubach, M. (2005). Redundância e sinergia de conjuntos neuronais no córtex motor. J. Neurosci. 25, 4207 & # x20134216. doi: 10.1523 / JNEUROSCI.4697-04.2005

Nguyen, H. C., Zeccina, R. e Berg, J. (2017). Problemas estatísticos inversos: do problema de Ising inverso à ciência de dados. Adv. Phys. 66, 197 & # x2013261. doi: 10.1080 / 00018732.2017.1341604

Nonnenmacher, M., Behrens, C., Berens, P., Bethge, M. e Macke, J. H. (2017). As assinaturas de criticidade surgem da subamostragem aleatória em modelos populacionais simples. PLoS Comput. Biol. 13: e1005718. doi: 10.1371 / journal.pcbi.1005718

Ocko, S., Lindsey, J., Ganguli, S. e Deny, S. (2018). O surgimento de vários tipos de células retinais por meio da codificação eficiente de filmes naturais. bioRxiv [Pré-impressão]. doi: 10.1101 / 458737

Ohiorhenuan, I. E., Mechler, F., Purpura, K. P., Schmid, A. M., Hu, Q., e Victor, J. D. (2010). Codificação esparsa e correlações de alta ordem em redes corticais de escala fina. Natureza 466, 617 e # x2013621. doi: 10.1038 / nature09178

Okun, M., Steinmetz, N., Cossell, L., Iacaruso, M. F., Ko, H., Bartho, P., et al. (2015). Acoplamento diversificado de neurônios a populações no córtex sensorial. Natureza 521, 511 e # x2013515. doi: 10.1038 / nature14273

Olshausen, B. A. e Field, D. J. (1996). Emergência de propriedades de campo receptivo de células simples ao aprender um código esparso para imagens naturais. Natureza 381, 607 e # x2013609. doi: 10.1038 / 381607a0

Olveczky, B. P., Baccus, S. A. e Meister, M. (2003). Segregação do objeto e movimento de fundo na retina. Natureza 423, 401 e # x2013408. doi: 10.1038 / nature01652

Oram, M. W., Foldiak, P., Perrett, D. I. e Sengpiel, F. (1998). The & # x2018Ideal Homunculus & # x2019: decodificando sinais de população neural. Trends Neurosci. 21, 259 e # x2013265. doi: 10.1016 / s0166-2236 (97) 01216-2

Orban, G., Berkes, P., Fiser, J. e Lengyel, M. (2016). Variabilidade neural e representações probabilísticas baseadas em amostragem no córtex visual. Neurônio 92, 530 e # x2013543. doi: 10.1016 / j.neuron.2016.09.038

Palmer, S. E., Marre, O., Berry, M. J. II e Bialek, W. (2015). Informações preditivas em uma população sensorial. Proc. Natl. Acad. Sci. EUA. 112, 6908 e # x20136913. doi: 10.1073 / pnas.1506855112

Panzeri, S., Schultz, S. R., Treves, A. e Rolls, E. T. (1999). Correlações e codificação de informações no sistema nervoso. Proc. Biol. Sci. 266, 1001 e # x20131012. doi: 10.1098 / rspb.1999.0736

Pesaran, B. (2010). Correlações neurais, decisões e ações. Curr. Opiniões Neurobiol. 20, 166 & # x2013171. doi: 10.1016 / j.conb.2010.03.003

Pillow, J. W., Shlens, J., Paninski, L., Sher, A., Litke, A. M., Chichilnisky, E. J., et al. (2008). Correlações espaço-temporais e sinalização visual em uma população neuronal completa. Natureza 454, 995 e # x2013999. doi: 10.1038 / nature07140

Pitkow, X. e Meister, M. (2012). Decorrelação e codificação eficiente pelas células ganglionares da retina. Nat. Neurosci. 15, 628 e # x2013635. doi: 10.1038 / nn.3064

Pouget, A., Dayan, P. e Zemel, R. (2000). Processamento de informações com códigos de população. Nat. Rev. Neurosci. 1, 125 e # x2013132. doi: 10.1038 / 35039062

Prentice, J. S., Marre, O., Ioffe, M. L., Loback, A. R., Tka & # x010Dik, G., e Berry, M. J. II (2016). Modos robustos de erro do código de população da retina. PLoS Comput. Biol. 12: e1005148. doi: 10.1371 / journal.pcbi.1005148

Press & # x00E9, S., Ghosh, K., Lee, J. e Dill, K. A. (2013). Princípios de entropia máxima e calibre máximo em física estatística. Rev. Modern Phys. 85: 1115. doi: 10.1103 / revmodphys.85.1115

Puchalla, J. L., Schneidman, E., Harris, R. A. e Berry, M. J. (2005). Redundância no código populacional da retina. Neurônio 46, 493 e # x2013504. doi: 10.1016 / j.neuron.2005.03.026

Quian Quiroga, R. e Panzeri, S. (2009). Extraindo informações de populações neuronais: teoria da informação e abordagens de decodificação. Nat. Rev. Neurosci. 10, 173 e # x2013185. doi: 10.1038 / nrn2578

Raichle, M. E. (2015). A rede de modo padrão do brain & # x2019s. Annu. Rev. Neurosci. 38, 433 e # x2013447. doi: 10.1146 / annurev-neuro-071013-014030

Rao, R. P. e Ballard, D. H. (1999). Codificação preditiva no córtex visual: uma interpretação funcional de alguns efeitos de campo receptivo extra-clássicos. Nat. Neurosci. 2, 79 e # x201387. doi: 10.1038 / 4580

Rieke, F., Warland, D., de Ruyter, van Steveninck, R. e Bialek, W. (1996). Picos & # x2013Explorando o código neural. Cambridge, MA: MIT Press.

Riesenhuber, M. e Poggio, T. (1999). Modelos hierárquicos de reconhecimento de objetos no córtex. Nat. Neurosci. 2, 1019 e # x20131025. doi: 10.1038 / 14819

Rodieck, R. W. (1965). Análise quantitativa da resposta das células ganglionares da retina do gato a estímulos visuais. Vision Res. 5, 583 e # x2013601. doi: 10.1016 / 0042-6989 (65) 90033-7

Schnabel, S., Seaton, D. T., Landau, D. P. e Bachmann, M. (2011). Pontos de inflexão da entropia microcanônica: chave para a compreensão sistemática das transições em sistemas finitos. Phys. Rev. E 84:011127.

Schneidman, E., Berry, M. J. II e Bialek, W. (2005). & # x201CDe pares para populações & # x2013 Correlações e informações em redes de neurônios, & # x201D em Proceedings of the Computational and Systems Neuroscience (COSYNE), Salt Lake City, UT.

Schneidman, E., Berry, M. J. II, Segev, R. e Bialek, W. (2006). Correlações pareadas fracas implicam em estados de rede fortemente correlacionados em uma população neural. Natureza 440, 1007 e # x20131012. doi: 10.1038 / nature04701

Schneidman, E., Bialek, W. e Berry, M. J. II (2003a). Sinergia, redundância e independência em códigos populacionais. J. Neurosci. 23, 11539 e # x201311553. doi: 10.1523 / jneurosci.23-37-11539.2003

Schneidman, E., Puchalla, J. L., Segev, R., Harris, R. A., Bialek, W., e Berry, M. J. II (2011). Sinergia do silêncio em um código neural combinatório. J. Neurosci. 31, 15732 & # x201315741. doi: 10.1523 / JNEUROSCI.0301-09.2011

Schneidman, E., Still, S., Berry, M. J. II e Bialek, W. (2003b). Informações de rede e correlações conectadas. Phys. Rev. Lett. 91:238701.

Schnitzer, M. J. e Meister, M. (2003). Padrões de disparo multinuronais no sinal do olho para o cérebro. Neurônio 37, 499 e # x2013511. doi: 10.1016 / s0896-6273 (03) 00004-7

Schwab, D. J., Nemenman, I. e Mehta, P. (2014). Lei de Zipf & # x2019s e criticidade em dados multivariados sem ajuste fino. Phys. Rev. Lett. 113:068102.

Schwartz, G., Macke, J., Amodei, D., Tang, H. e Berry, M. J. II (2012). Baixa discriminação de erro usando um código de população correlacionado. J. Neurophysiol. 108, 1069 e # x20131088. doi: 10.1152 / jn.00564.2011

Segev, R., Puchalla, J. e Berry, M. J. II (2006). Organização funcional das células ganglionares na retina da salamandra. J. Neurophysiol. 95, 2277 & # x20132292. doi: 10.1152 / jn.00928.2005

Shamir, M. e Sompolinsky, H. (2006). Implicações da diversidade neuronal na codificação da população. Neural Comput. 18, 1951 e # x20131986. doi: 10.1162 / neco.2006.18.8.1951

Sharpee, T. O. (2017). Otimizando a capacidade de informação neural por meio da discretização. Neurônio 94, 954 e # x2013960. doi: 10.1016 / j.neuron.2017.04.044

Shew, W. L. e Plenz, D. (2013). Os benefícios funcionais da criticidade no córtex. Neuro cientista 19, 88 e # x2013100. doi: 10.1177 / 1073858412445487

Shimazaki, H., Sadeghi, K., Ishikawa, T., Ikegaya, Y., e Toyoizumi, T. (2015). O silêncio simultâneo organiza interações estruturadas de ordem superior em populações neurais. Sci. Rep. 5: 9821. doi: 10.1038 / srep09821

Shlens, J., Field, G. D., Gauthier, J. L., Greschner, M., Sher, A., Litke, A. M., et al. (2009). A estrutura de disparo sincronizado em grande escala na retina de primatas. J. Neurosci. 29, 5022 e # x20135031. doi: 10.1523 / jneurosci.5187-08.2009

Shlens, J., Field, G. D., Gauthier, J. L., Grivich, M. I., Petrusca, D., Sher, A., et al. (2006). A estrutura dos padrões de disparo de vários neurônios na retina de primatas. J. Neurosci. 26, 8254 e # x20138266. doi: 10.1523 / jneurosci.1282-06.2006

Smirnakis, S.M., Berry, M.J., Warland, D.K., Bialek, W. e Meister, M. (1997). Adaptação do processamento retinal ao contraste da imagem e escala espacial. Natureza 386, 69 & # x201373. doi: 10.1038 / 386069a0

Smith, M. A. e Kohn, A. (2008). Escalas espaciais e temporais de correlação neuronal no córtex visual primário. J. Neurosci. 28, 12591 e # x201312603. doi: 10.1523 / JNEUROSCI.2929-08.2008

Assim, K., Ganguly, K., Jimenez, J., Gastpar, M. C. e Carmena, J. M. (2012). Codificação de informação redundante no córtex motor primário durante o controle motor natural e protético. J. Comput. Neurosci. 32, 555 e # x2013561. doi: 10.1007 / s10827-011-0369-1

Sompolinsky, H., Yoon, H., Kang, K. e Shamir, M. (2001). Codificação de populações em sistemas neuronais com ruído correlacionado. Phys. Rev. E Stat. Nonlin Soft Matter Phys. 64 (5 Pt 1), 051904.

Srinivasan, M. V., Laughlin, S. B. e Dubs, A. (1982). Codificação preditiva: uma nova visão da inibição na retina. Proc. R. Soc. Lond. B Biol. Sci. 216, 427 & # x2013459. doi: 10.1098 / rspb.1982.0085

Strong, S. P., Koberle, R., de Ruyter, van Steveninck, R. R. e Bialek, W. (1998). Entropia e informação em trens de espículas neurais. Phys. Rev. Lett. 80, 197 e # x2013200. doi: 10.1103 / physrevlett.80.197

Tka & # x010Dik, G., Marre, O., Amodei, D., Schneidman, E., Bialek, W., e Berry, M. J. II (2014). Em busca de comportamento coletivo em uma grande rede de neurônios sensoriais. PLoS Comput. Biol. 10: e1003408. doi: 10.1371 / journal.pcbi.1003408

Tka & # x010Dik, G., Mora, T., Marre, O., Amodei, D., Palmer, S. E., e Berry, M. J. II, et al. (2015). Termodinâmica e assinaturas de criticidade em uma rede de neurônios. Proc. Natl. Acad. Sci. EUA. 112, 11508 e # x201311513. doi: 10.1073 / pnas.1514188112

Tka & # x010Dik, G., Prentice, J. S., Balasubramanian, V., e Schneidman, E. (2010). Codificação ótima da população por neurônios de pico barulhento. Proc. Natl. Acad. Sci. EUA. 107, 14419 e # x201314424. doi: 10.1073 / pnas.1004906107

Tka & # x010Dik, G., Schneidman, E., e Berry, M. J. II e Bialek, W. (2006). Modelos de Ising para redes de neurônios reais. arXiv.q-bio /0611072 [Pré-impressão]. Disponível em: https://arxiv.org/abs/q-bio/0611072.

Traub, R. D., Whittington, M. A., Stanford, I. M. e Jefferys, J. G. (1996). Um mecanismo para geração de oscilações rápidas síncronas de longo alcance no córtex. Natureza 383, 621 e # x2013624. doi: 10.1038 / 383621a0

Ungerleider, L. G. e Haxby, J. V. (1994). & # x2018O que & # x2019 e & # x2018onde & # x2019 no cérebro humano. Curr. Opiniões Neurobiol. 4, 157 & # x2013165. doi: 10.1016 / 0959-4388 (94) 90066-3

Uzzell, V. J. e Chichilnisky, E. J. (2004). Precisão de trens de espinhos em células ganglionares retinais de primatas. J. Neurophysiol. 92, 780 & # x2013789. doi: 10.1152 / jn.01171.2003

van Hateren, J. H., Ruttiger, L., Sun, H. e Lee, B. B. (2002). Processamento de estímulos temporais naturais por células ganglionares retinais de macacos. J. Neurosci. 22, 9945 e # x20139960. doi: 10.1523 / jneurosci.22-22-09945.2002

van Wyk, M., Taylor, W. R. e Vaney, D. I. (2006). Detectores locais de borda: um substrato para visão espacial precisa em baixas frequências temporais na retina de coelhos. J. Neurosci. 26, 13250 & # x201313263. doi: 10.1523 / JNEUROSCI.1991-06.2006

Vaney, D. I., Peichl, L., Wassle, H. e Illing, R. B. (1981). Quase todas as células ganglionares da retina do coelho se projetam para o colículo superior. Brain Res. 212, 447 e # x2013453. doi: 10.1016 / 0006-8993 (81) 90476-5

Victor, J. D. e Purpura, K. P. (1998). Fase espacial e a estrutura temporal da resposta às grades em V1. J. Neurophysiol. 80, 554 e # x2013571. doi: 10.1152 / jn.1998.80.2.554

Werblin, F., Roska, B. e Balya, D. (2001). Processamento paralelo na retina de mamíferos: interações laterais e verticais em representações empilhadas. Prog. Brain Res. 131, 229 & # x2013238. doi: 10.1016 / s0079-6123 (01) 31019-1

Wilke, S. D. e Eurich, C. W. (2002). Precisão representacional de populações neurais estocásticas. Neural Comput. 14, 155 e # x2013189. doi: 10.1162 / 089976602753284482

Yu, S., Yang, H., Shriki, O., e Plenz, D. (2013). Organização universal da atividade cerebral em repouso no ponto crítico termodinâmico. Frente. Syst. Neurosci. 7:42. doi: 10.3389 / fnsys.2013.00042

Zemel, R. S., Dayan, P. e Pouget, A. (1998). Interpretação probabilística de códigos de população. Neural Comput. 10, 403 e # x2013430. doi: 10.1162 / 089976698300017818

Zohary, E., Shadlen, M. N. e Newsome, W. T. (1994). Taxa de descarga neuronal correlacionada e suas implicações para o desempenho psicofísico. Natureza 370, 140 e # x2013143. doi: 10.1038 / 370140a0

Zylberberg, J., Cafaro, J., Turner, M. H., Shea-Brown, E., e Rieke, F. (2016). Os circuitos com seleção de direção modelam o ruído para garantir um código de população preciso. Neurônio 89, 369 e # x2013383. doi: 10.1016 / j.neuron.2015.11.019

Palavras-chave: codificação populacional, entropia máxima, teoria da informação, correlações, clusters, correção de erros, aprendizagem não supervisionada, criticidade

Citação: Berry MJ II e Tka & # x010Dik G (2020) Clustering of Neural Activity: A Design Principle for Population Codes. Frente. Comput. Neurosci. 14h20. doi: 10.3389 / fncom.2020.00020

Recebido: 17 de setembro de 2019 Aceito: 18 de fevereiro de 2020
Publicado: 13 de março de 2020.

Nicolas Brunel, Duke University, Estados Unidos

David Jason Schwab, Northwestern University, Estados Unidos
Taro Toyoizumi, RIKEN Brain Science Institute (BSI), Japão

Copyright & # x00A9 2020 Berry e Tka & # x010Dik. Este é um artigo de acesso aberto distribuído sob os termos da Creative Commons Attribution License (CC BY). O uso, distribuição ou reprodução em outros fóruns é permitido, desde que o (s) autor (es) original (is) e o (s) proprietário (s) dos direitos autorais sejam creditados e que a publicação original nesta revista seja citada, de acordo com a prática acadêmica aceita. Não é permitida a utilização, distribuição ou reprodução em desacordo com estes termos.


Na Eq. 2, onde deixamos cair a menção explícita de no argumento. As funções de transferência mediar a contribuição de populações individuais para as respostas medidas são dadas pelas seguintes expressões: (A.1)

5. Trabalho Relacionado

5.1. Modelos de codificação preditiva.

Um tipo semelhante de interação entre a inferência bayesiana hierárquica e o aprendizado natural da imagem foi estudado no trabalho seminal sobre o modelo de codificação preditiva (Rao & amp Ballard, 1999). Nisso, embora o algoritmo de inferência seja determinístico, ele pode ser reformalizado como uma inferência bayesiana computando a explicação mais provável de uma determinada entrada. Usando seus algoritmos de inferência e aprendizagem, eles reproduziram com sucesso uma variedade de propriedades de campo receptivo clássicas e não clássicas do córtex visual inicial, incluindo parada final, pop-outs e supressão surround.

No entanto, uma crítica ao modelo de codificação preditiva original foi a interação linear (aditiva ou subtrativa) entre os sinais de cima para baixo e de baixo para cima, que era inconsistente com os efeitos multiplicativos conhecidos do feedback cortical (McAdams & amp Maunsell, 1999 Treue, 2001). Esta questão foi abordada por uma proposta mais recente de modelo de codificação preditiva não linear (Spratling, 2008, 2010, 2011), que modificou as regras de atualização no algoritmo de inferência de forma multiplicativa. Assim, o novo modelo reproduziu com sucesso uma gama mais ampla de propriedades não clássicas de V1, incluindo efeitos de atenção (Spratling, 2008), bem como supressão de orientação cruzada e modulação surround (Spratling, 2010). No entanto, a desvantagem era que ele não tinha mais uma interpretação bayesiana clara e não tinha função objetivo para inferência e aprendizagem. Consequentemente, a convergência da computação foi explicada apenas informalmente (Spratling, 2011), e o resultado da computação foi bastante difícil de interpretar estatisticamente .

Em nosso modelo, a interação entre os sinais de cima para baixo e de baixo para cima é governada pelo teorema de Bayes, que tem natureza inerentemente multiplicativa. Consequentemente, os sinais de feedforward não representam erros de previsão, mas “correspondências de previsão”, que têm o efeito de aguçar os sinais sensoriais ascendentes que concordam com as previsões descendentes (Murray, Schrater, & amp Kersten, 2004). Este fato foi crucial em nossa simulação de preenchimento (ver seção 4.5), bem como em trabalhos anteriores de reprodução de efeitos de atenção (Rao, 2005 Chikkerur et al., 2010). No entanto, uma questão remanescente é se a modulação surround, um fenômeno predominantemente observado em V1, também pode ser explicada em nosso modelo (consulte a seção 6 para uma discussão mais aprofundada).

É importante notar que a codificação preditiva interpreta as atividades neurais como os valores de estados contínuos, enquanto nosso modelo as considera como as probabilidades de estados discretos. Com base nos conhecimentos atuais em fisiologia, está longe de ser claro qual interpretação é mais plausível. No entanto, a interpretação probabilística atraiu muita atenção dos lados experimental e teórico em nome da "hipótese de amostragem" (Hoyer & amp Hyvärinen, 2002a Fiser, Berkes, Orbán, & amp Lengyel, 2010 Berkes, Orbán, Lengyel, & amp Fiser, 2011 Buesing , Bill, Nessler & amp Maass, 2011). Em particular, Berkes et al. (2011) demonstraram que as atividades espontâneas de múltiplos neurônios (supostamente representando a distribuição anterior) tornaram-se gradualmente mais próximas de suas atividades médias evocadas por imagens naturais (a posterior média) conforme o animal crescia. Este resultado parece ser bastante compatível com o nosso esquema de aprendizagem, que busca um modelo interno o mais próximo possível do mundo visual externo.

5,2 Modelos de máquinas Boltzmann restritos.

A esparsa rede de crença profunda é uma pilha de modelos gráficos simétricos (ou seja, máquinas de Boltzmann restritas). Eles usaram um algoritmo de aprendizagem rápida e inferência com base na divergência contrastiva (Lee et al., 2008) para reproduzir uma hierarquia de representações semelhante a células simples V1 e V2, a última foi comparada com um conjunto de dados experimentais em V2 (Ito & amp Komatsu , 2004) complementar ao que usamos. No entanto, seu modelo não é bayesiano no sentido de que a inferência na hierarquia precisa ser realizada camada por camada e, como resultado, o cálculo em toda a rede não produz uma interpretação probabilística simples. Essa desvantagem teórica pode ser ainda mais pronunciada em uma tarefa que envolve inferência complexa. Por exemplo, em nossa simulação de preenchimento, uma parte das variáveis ​​visíveis não é corrigida para representar um ponto cego e exatamente o mesmo algoritmo de inferência pode ser usado para obter uma probabilidade posterior. Nesse caso, algumas modificações seriam necessárias, uma vez que a computação camada por camada simples não é suficiente e, mesmo nesse caso, o resultado não teria uma interpretação direta.

5.3. Modelos de rede multinomial.

Muitos poucos estudos usaram redes bayesianas multinomiais para modelar a computação do córtex visual. Variáveis ​​multinomiais normalmente têm servido como uma maneira útil de modelar hipercolunas compostas de minicolunas que representam recursos (George & amp Hawkins, 2005 Rao, 2005 Ichisugi, 2007 Röhrbein et al., 2007 Chikkerur et al., 2010 Hosoya, 2010) ou como um mecanismo para explicar a normalização divisiva dirigida pela atenção (Rao, 2005 Chikkerur et al., 2010). No entanto, até onde sabemos, não houve propostas de métodos de aprendizagem natural de imagens que funcionassem para redes Bayesianas multinomiais hierárquicas.

Uma novidade em nosso trabalho é explorar variáveis ​​multinomiais para impor implicitamente a dispersão. A dispersão é conhecida por ser uma restrição importante nas atividades da unidade para obter representações de recursos eficientes, como propriedades de campo receptivo visual de manchas de imagens naturais (Olshausen & amp Field, 1996). De fato, em uma simulação separada usando variáveis ​​binárias (esparsidade 0,5), não pudemos observar quaisquer características significativas que surgiram. No entanto, nosso mecanismo de esparsidade pode parecer bastante incomum, uma vez que os modelos anteriores normalmente controlam a esparsidade por meio de um termo de regularização (Olshausen & amp Field, 1996 Lee et al., 2008), enquanto os nossos hard-wire sparsity pelo número de estados permitidos para uma variável. Essa poderia ser uma restrição potencialmente severa, uma vez que uma única amostra de ativação permite que exatamente uma unidade esteja ativa para cada variável, embora nossa simulação tenha produzido várias propriedades de campo receptivo semelhantes aos neurônios visuais reais. Uma abordagem alternativa seria empregar uma rede com variáveis ​​binárias com dispersão explícita imposta em cada variável. Embora resultados semelhantes devam, em princípio, surgir de tal modelo binário, é amplamente considerado que essa abordagem requer um tempo de computação proibitivamente grande (Hinton, 2007).

Finalmente, vale a pena apontar que nosso modelo sugere implicitamente que a normalização divisiva e a esparsidade, que são fenômenos aparentemente diferentes, podem ser causadas pelo mesmo mecanismo neural. Isso pode fazer sentido, uma vez que a forma mais plausível de implementar qualquer um deles seria a inibição horizontal (Kisvárday, Tóth, Rausch, & amp Eysel, 1997).


Assista o vídeo: #1-Não é velho é classico: Apresentação (Janeiro 2022).