A Onda 3D

* Como enxergamos em 3d ?

O nosso sistema cérebro-olhos se utiliza de uma combinação de técnicas para avaliar a profundidade dos objetos observados. As mais importantes:

(1) O músculo ciliar envolve o cristalino, alterando sua curvatura para permitir a focalização de objetos na retina situados a diversar distâncias. O esforço de tal músculo para focalizar um objeto de interesse é uma importante medida da profundidade 3d em que se encontra tal objeto em relação a nossos olhos.

(2) Os músculos extraoculares tentam mover os olhos (aproximando-os ou afastando-os de um centro no infinito, comum aos dois olhos) na tentativa de sobrepor nas imagens combinadas pelas retinas o objeto de interesse. Isto complementa a informação dos músculos ciliares: objetos próximos demais tendem a fazer os dois olhos convergirem cada vez mais para um ponto entre eles, enquanto objetos muito distantes tentem a colocá-los apontando direções paralelas.

(3) Com o objeto de interesse focado pelo método acima, os objetos periféricos, a distâncias diferentes, parecem cada vez mais deslocados na imagem de cada olho à medida em que suas distâncias divergem da distância focada. Esta diferença, chamada de desvio de paralaxe, é a característica mais utilizada nas atuais técnicas de reprodução de imagens e vídeos em 3d. E é a mais importante nas pessoas em que tal capacidade é normal. As divergências nas duas anteriores podem causar desconforto, mas sem afetar muito a força desta.

* Como enganar nossos olhos ?

Algumas técnicas de representação de imagens não exigem que nossos olhos sejam "enganados", pois realmente armazenam uma informação tridimensional do objeto representado. É o que acontece com os hologramas. Mas além de um meio caro de armazenar tal informação, existem várias outras desvantagens: perda de informação cromática, dificuldade de fazer o registro exceto em situações bem controladas de laboratório, etc.

As técnicas atuais de 3d consistem em enviar imagens diferentes a cada olho. Quando digo que é uma "enganação", quero dizer que o que se registra de verdade não é uma informação 3d real, mas duas informações em 2d cuja interpretação correta das profundidades é delegada a nosso próprio cérebro! Pessoas normalmente sem capacidade de enxergar em 3d (por exemplo, por séria deficiência ou cegueira total de um dos olhos, bem como casos bem acentuados de estrabismo) não se beneficiam destas técnicas. Normalmente tais pessoas extraem a informação de profundidade das imagens por outros meios, como comparação de dimensões de objetos de tamanho conhecido, linhas de perspectiva, etc. Elas conseguem avaliar a distância dos objetos nas imagens, mas certamente não têm a mesma noção de profundidade que têm as pessoas normais.

Uma "vantagem" inusitada das atuais técnicas de 3d é a seguinte: TODOS os objetos da cena estão focalizados, independente de suas distâncias! Isso talvez explique o comentário de algumas pessoas após sua experiência 3d, dizendo que as imagens parecem "mais reais que a realidade". Mas sempre é possível, caso se queira dar maior verossimilhança à cena, enfatizar objetos a uma distância específica "desfocando" artificialmente os que estão fora. Inclusive é uma técnica bastante usada em filmes 2d tradicionais. Nos filmes 3d gerados por animação gráfica, isto precisa ser simulado se a intenção é manter este efeito das câmeras reais...

* Técnicas de separação de imagens

Várias foram as formas encontradas de se enviar imagens ligeiramente diferentes a cada olho do espectador, a fim de dar a ilusão de profundidade na cena. Algumas permitem observar o efeito sem aparato especial em contato com os olhos (embora possam necessitar de algum sobre a imagem representada). Outros exigem dispositivos especiais, como óculos e prismas. Vamos a eles:

** 3d a olho nu

Podem ser citados dois métodos principais:

(1) Focalização forçada de imagens muito separadas (técnica do "vesgo")

As duas imagens são colocadas lado a lado, e o observador trabalha os músculos extraoculares numa sobreposição anti-natural para combiná-las. Uma das desvantagens é que o cérebro logo percebe que a informação dos músculos extra-oculares não combina com a dos músculos ciliares: aqueles parecem se esforçar para focar um objeto que, aparentemente, não exigem tanto esforço do cristalino. É como tentar observar um objeto "perto demais" que na verdade está a uma distância normalmente confortável, o que causa confusão mental. Com a prática se consegue o efeito muito rápido. Por não apresentar nenhum tipo de deformação cromática ou de intensidade, é ótimo para avaliações rápidas da qualidade de uma tomada em 3d, antes de combinar as imagens por alguma outra técnica. Poucas pessoas conseguem manter o efeito por tempo muito longo.

(2) 3d lenticular

Uma camada transparente de uma placa formada de barras hemicilíndricas verticais finas separam a imagem sob a placa de tal forma que cada olho vê uma imagem diferente. É uma técnica de certa forma parecida com o efeito estereofônico dos aparelhos de som, uma vez que o observador precisa estar dentro de uma região específica em relação à fonte para apreciar o efeito. Além do efeito 3d, a mesma técnica permite a ilusão de movimento em vídeos curtíssimos (entre 4 ou 8 quadros, para lentes hiperfinas), morphing de imagens e até o falso-holograma (ilusão de objeto tridimensional ao menos quando movido no sentido horizontal).

O fato da película segmentar verticalmente a imagem pode ser um incômodo (precisa de barras cada vez mais finas, o que deixa a técnica cada vez mais difícil e cara), bem como a necessidade do observador se colocar num ponto privilegiado para obter o efeito. Foi e vem sendo usada como uma solução barata para monitores 3d sem óculos.

(3) padrões repetitivos

Na verdade uma variação da primeira técnica, cuja repetição de padrôes nas imagens permite que elas sejam sobrepostas sem uma grande separação: a maior parte das duas imagens são comuns, obrigando os olhos a se desviarem muito pouco. A disparidade com os músculos ciliares chega a ser desprezível.Obviamente só funciona para imagens bem especiais e preparadas, todas elas geradas artificialmente.

(4) deformações anamórficas (fantogramas)

Basicamente consiste em representar numa superfície horizontal uma imagem que, deformada, é interpretada como estando no plano vertical. Não se tem um efeito real de diferentes profundidades: a ilusão se deve mais à confusão mental, de se tentar colocar à mesma distância na vertical pontos que ESTÃO a diferentes distâncias na horizontal. Também depende muito de ser observada num ponto especial em relação à imagem.

** 3d com aparatos auxiliares

Alguns aparatos em frente aos olhos podem facilitar a visualização de duas imagens separadas. Enfatizando: todas estas técnicas têm vantagens e desvantagens.

(1) estereógrafos

Trata-se de uma técnica bem antiga, conhecida praticamente desde pouco depois da invenção da fotografia. Aqui também temos as duas imagens uma ao lado da outra, que podem inclusive ser visualizadas em 3d usando a técnica a olho nu descrita acima. Mas para evitar este desconforto visual, um prisma sobrepõe as imagens de tal forma que não é necessário um grande esforço para visualizá-las sobrepostas.

(2) óculos coloridos

Técnica também relativamente antiga, e bastante barata. Bem eficiente se a informação de cor das imagens não for muito importante. A idéia é sobrepor duas imagens aplicando sobre elas faixas distintas do espectro luminoso. É sabido que uma lente vermelha deixa passar toda a luz vermelha, bem como parte da luz branca (que contém o vermelho). E uma lente azul deixa passar toda a luz azul, e também a branca (que contém azul). É possível sobrepor desta forma duas imagens numa folha de papel ou numa tela de computador, de tal forma que possa se enviar a cada olho uma imagem ligeiramente diferente. O cérebro de certa forma tenta ignorar a disparidade cromática, e interpreta as diferenças de luminância como profundidade.

Óbviamente tentou-se aprimorar esta idéia original. Com uma lente verde, por exemplo, foi possível se manter parte da informação comum do espectro em torno do amarelo, que tanto o filtro vermelho quanto o verde deixavam passar parcialmente. Conhecida como anáglifos, várias combinações de filtros foram experimentadas: vermelho-azul, vermelho-verde, vermelho-ciano, magenta-ciano, verde-magenta, âmbar-azul, etc... fica claro que a vantagem de um sobre o outro depende muito da imagem representada! Usar filtros coloridos para separar imagens sempre causará distorções cromáticas, que só não são percebidas se REALMENTE as cores do espectro distorcidas não fizerem parte da imagem representada, ou representarem muito pouco dela...

Um método bastante interessante é o que usa uma combinação diferente de vermelho, verde e azul em cada um dos olhos. Neste método, o filtro vermelho do olho esquerdo escolhe parte bem estreita e específica do espectro enviada ao olho, enquanto o do direito também filtra uma parte vermelha do espectro, mas não conflitante com a primeira. O mesmo ocorre para as duas outras cores. A combinação delas (que, afinal, é o percebido por nossas retinas) geram toda a gama do espectro. A confecção de tal filtro é extremamente complicada e cara. Cara também a impressão para ser visualizada com tais filtros, pois os pigmentos também PRECISAM gerar cores dentro de tais espectros bem limitados. O uso de polarizadores (próxima técnica) fornece solução equivalente ou mesmo melhores, por um custo bem inferior!

(3) polarizadores de luz

Método bastante usado nas atuais TVs 3d com óculos passivos (quer dizer, não precisam de pilhas para funcionar). O olho esquerdo recebe o espectro luminoso completo, mas polarizado na horizontal, enquanto o direito recebe a luz polarizada verticalmente (ou vice-versa). É necessário a existência de polarizadores também em frente a cada pixel da tela emissora, o que encarece o equipamento. Dificuldade inexistente em projetores, que podem colocar um polarizador completo em frente de cada uma das lentes projetoras. Uma enorme desvantagem: você precisa estar sentado (na vertical) para conseguir o efeito 3d. Se você se deitar no sofá, as imagens captadas pelos óculos se invertem, e o efeito é perdido (você vai ver uma combinação bem confusa, com cada olho vendo o que o outro deveria ver!) Não sei se existe um ajuste disto nos atuais aparelhos. Prometo pesquisar!

Uma outra desvantagem apontada é a de que tais polarizadores escureceriam a imagem. Já estão sendo desenvolvidos polarizadores melhores, com menor efeito sobre a luminosidade das cenas.

(4) óculos dinâmicos

É bem conhecido que a ilusão de movimento da TV e cinema é criada por uma sucessão de imagens estáticas. Normalmente cada imagem é enviada aos dois olhos nas transmissões 2d convencionais. E se for possível alternar, enviando apenas para um olho de cada vez? Este é o princípio dos óculos dinâmicos.

Para o aparelho de TV, a mudança não é muito grande: a mesma tela que transmite em 2d pode ser adaptada para alternar as imagens a cada quadro. Fisicamente, nenhuma alteração é necessária. Com os óculos, já é diferente...

Para conseguir a ilusão, o óculos precisa estar sincronizado com a TV, e tapar dinamicamente o olho que não deve receber o quadro de imagem atual, permitindo que apenas o olho alvo a receba. Isso feito a uma frequência suficientemente elevada, a cintilação não é percebida.

Uma desvantagem óbvia: é necessário um óculos com um circuito eletrônico adicional, além de um transmissor na TV e um receptor no óculos, o que encarece o projeto. Além, é claro, do óculos precisar ser agora alimentado por uma fonte externa de energia.

Apesar de não existirem resultados conclusivos, também sempre fica a suspeita: como todas as demais fontes que se utilizam de emissores repetitivos (inclusive sonoros), recomenda-se que isto seja evitado por quem possua certo grau de epilepsia. A cintilação poderia iniciar uma crise...

* meu atual interesse

Estou interessado na conversão automática, ou pelo menos semi-automática, de uma imagem 2d em duas imagens 2d com desvio de paralaxe que, combinadas, criem a ilusão de profundidade. Desenvolvi um bom algoritmo que faz parte disso, transformando em 3d uma imagem 2d de profundidades pré-calculadas. Meu foco no momento é em como gerar tais profundidades automaticamente. Acreditem, é difícil!!! :-)

Meu foco não é em como apresentá-las (isto já foi resolvido faz tempo!). Mas como é uma parte muito importante na finalização do processo, me interesso pela questão! Tentei resumir aqui o que aprendi com minhas buscas... :-)