Marketing, hosting, servidores, midia, tecnologia

O futuro da fotografia

AI: O futuro da fotografia?

Introdução
Ao ouvir as palavras “IA”, “Aprendizado de Máquina” ou “bot”, a maioria das pessoas tende a visualizar um robô andante que fala algo parecido com um filme de ficção científica e imediatamente assume um tempo distante no futuro.

Desculpe pessoal! A IA existe há anos e atualmente está residindo em seu smartphone (adoramos o Siri / Google Assistant!), O sistema de GPS do seu carro e até mesmo pensando em qual artigo ele recomendará para você assim que terminar de ler isso. No entanto, nenhum domínio foi mais afetado por ele nos últimos anos do que o da visão computacional.

Com o advento da tecnologia, está se tornando cada vez mais comum ver imagens visualmente atraentes com resolução ultra-alta. As pessoas não precisam mais aprender usando ferramentas como o Photoshop e o CorelDRAW para aprimorar e alterar suas imagens. A IA já está sendo usada em todos os aspectos do aumento e manipulação de imagens para produzir as melhores imagens possíveis. No entanto, a ideia mais recente a surgir é na verdade usar AI para gerar imagens, sinteticamente.

Quase todas as imagens que você possa ter visto seriam uma fotografia capturada ou criadas manualmente por uma pessoa viva que respira. Existem, possivelmente, centenas de ferramentas para produzir imagens manualmente, mas elas exigem uma presença humana para presidir o processo. Entretanto, imagine um programa de computador que desenhe do zero qualquer coisa que você disser. O Drawing Bot da Microsoft pode ser uma das primeiras e únicas tecnologias que tornam isso possível. Imagine um momento no futuro próximo, quando você pode simplesmente baixar um aplicativo em seu smartphone e dar-lhe algumas instruções, como “Eu quero uma imagem de mim ao lado da Torre Eiffel. ”(Certifique-se de dizer corretamente, no entanto).

Redes Geradoras Adversariais (GANs)
“As GANs são a ideia mais interessante nos últimos 10 anos no ML”
– Yann LeCun
A base que faz tal geração de imagem sintética está nas Redes Adversariais Generativas. Desde sua descoberta e lançamento em 2014 por Ian Goodfellow e seus colegas em seu trabalho de pesquisa, as GANs permaneceram como um dos aspectos mais fascinantes e amplamente utilizados do Deep Learning. As intermináveis ​​aplicações desta tecnologia, que é o coração de algo chamado treinamento adversarial, engloba os domínios não apenas da visão computacional, mas também da análise de dados, robótica e modelagem preditiva.

Então, qual é o grande negócio sobre as GANs?

As Redes Geradoras Adversariais pertencem ao conjunto de modelos gerativos. Isso significa que o trabalho deles é criar ou “gerar” novos dados em um procedimento completamente automatizado.

Como o nome sugere, uma GAN é na verdade composta de duas redes neurais individuais que competem umas com as outras (de uma maneira contraditória). Uma rede neural, chamada de gerador, gera novas instâncias de dados que cria a partir de ruído aleatório, enquanto a outra, o discriminador, avalia sua autenticidade. Em outras palavras, o discriminador decide se cada instância de dados revisada pertence ao conjunto de dados de treinamento real ou não.

Um exemplo simples
Digamos que você tenha sido encarregado de fazer uma pintura idêntica a uma feita por um artista muito famoso. Infelizmente, você não sabe quem é esse artista ou viu uma de suas pinturas. Sua tarefa é forjar uma pintura e apresentá-la em um leilão como um dos originais. Então, você decide experimentá-lo. Tudo o que você vai precisar é de algumas tintas e uma tela, certo? No entanto, os leiloeiros não querem que as pessoas vendam algumas coisas aleatórias e querem apenas artigos genuínos, então eles contrataram um detetive que primeiro verificará todos os itens apresentados no leilão. Por sorte, o detetive tem suas próprias amostras das pinturas originais do famoso artista e quando você apresenta sua pintura aleatória, ele sabe imediatamente que isso não é nada como os originais.

Ele rejeita e você decide tentar novamente. Mas desta vez, você tem algumas dicas úteis, que o detetive deixou escapar quando ele avaliou sua tela, sobre o que a pintura deve realmente parecer.

Agora, quando você tentar a sua sorte novamente, a pintura deve ser um pouco melhor. Mas o detetive ainda não está convencido e te rejeita novamente. Então você continua tentando de novo e de novo, toda vez usando alguma forma de feedback para alterar a pintura e fica cada vez melhor (vamos presumir que o detetive está bem com você retornando intermináveis ​​vezes.) No final, depois de um mais ou menos mil tentativas, você finalmente consegue criar algo próximo a uma réplica perfeita. Como o detetive olha para suas pinturas de amostra, ele não tem certeza se o que você entregou a ele pode ser um deles ou mesmo algo mais que tem o mesmo estilo e traços do famoso artista.

Qual é o processo passo a passo de um GAN em funcionamento?
Aplicando o mesmo processo de pensamento a uma combinação de redes neurais, o treinamento de GANs consiste nas seguintes etapas:

· Eles não introduzem nenhum viés determinista. Certos métodos generativos, como os AutoEncoders Variacionais, introduzem um viés determinístico porque otimizam um limite inferior na probabilidade de log, em vez da própria probabilidade. Isso parece resultar em VAEs aprendendo a gerar amostras borradas em comparação com as GANs.

Da mesma forma, existem também as seguintes desvantagens:

· GANs são particularmente difíceis de treinar. A função que essas redes tentam otimizar é uma função de perda que essencialmente não tem forma fechada (ao contrário das funções de perda padrão, como log-loss ou squared error). Assim, otimizar essa função de perda é muito difícil e requer muita tentativa e erro em relação à estrutura da rede e ao protocolo de treinamento.

· Especificamente para a geração de imagens, não há medida adequada para avaliar a precisão. Como uma imagem sintética parece passável para o próprio computador, o resultado real é um tópico muito subjetivo e dependeria de um observador humano. Em vez disso, temos funções como o Inception Score e o Frechet Inception Distance para medir seu desempenho.

Aplicações de GANs
Aqui vem a parte divertida. Uma lista de todas as coisas incríveis que podemos fazer usando GANs. Entre todos os seus usos potenciais, as GANs encontraram um grande número de aplicações no campo da visão computacional.

Conversão de texto em imagem
Existem várias implementações para esse conceito, como o TAC-GAN – Rede Adversarial Generativa Auxiliar Classificadora de Textos. Eles são usados ​​para sintetizar imagens de suas descrições de texto.

As GANs encontraram uma grande popularidade em conceitos como transferência de estilo. Assista ao vídeo abaixo:

Inclui tradução de imagem para imagem usando um tipo especial de GAN chamado CGAN (Condicional Generative Adversarial Networks). A pintura e o conceito de design nunca foram tão fáceis assim. No entanto, embora GANs possam concluir fazendo desenhos simples como essa bolsa em seu esboço, desenhar coisas mais complexas como rostos humanos perfeitos atualmente não é um ponto forte da GAN. De fato, seus resultados são bastante apavorantes para certos objetos.

Duas aplicações interessantes de redes Generative podem ser vistas em Inpainting e Outpainting. O primeiro inclui o preenchimento ou ruído dentro de uma imagem, que pode ser considerado como reparação de imagem. Por exemplo, dada uma imagem com furos ou lacunas, uma GAN deve ser capaz de corrigi-la de forma “aceitável”. Outpainting, por outro lado, envolve o uso do próprio aprendizado da rede para imaginar como uma imagem pode parecer fora de seus limites atuais.

Graças às redes generativas, a síntese de faces é possível, o que envolve a geração de uma única imagem de face em diferentes ângulos. É por isso que o reconhecimento facial não requer centenas de amostras do seu rosto, mas pode ser trabalhado com um. Não só isso, gerando rostos artificiais também se tornou possível. A NVIDIA recentemente usou seu GAN 2.0 para gerar rostos humanos artificiais em resolução HD usando o conjunto de dados Celeba Hq, a primeira instância de geração de imagem sintética em alta resolução.

Rostos gerados de celebridades imaginárias por um GAN Progressivo. (Créditos da imagem: NVIDIA)
GANimação
Pequenos métodos intrincados também estão se tornando possíveis, como a mudança dos movimentos faciais. GANimation é um esforço de pesquisa usando o PyTorch que se define como “Animação Facial Anatomicamente Sensível a partir de uma Única Imagem”.

Outro exemplo de uso de GANs para tornar as imagens mais realistas é simplesmente transformar uma pintura (muito boa) em uma fotografia. Isso é feito usando um tipo especial de GAN chamado CycleGAN, que usa dois geradores e dois discriminadores. Chamamos um gerador G e convertemos imagens do domínio X para o domínio Y. O outro gerador é chamado F e converte imagens de Y para X. Cada gerador tem um discriminador correspondente, que tenta diferenciar suas imagens sintetizadas das reais.

Para onde vamos daqui ?
Aprendizado de Máquina e GANs certamente terão um tremendo impacto em imagens e fotografia no futuro próximo. Atualmente, essa tecnologia é capaz de gerar imagens simples a partir de entradas de texto. No entanto, no futuro previsível, seria capaz de criar não apenas imagens precisas em alta resolução, mas também vídeos inteiros. Imagine um filme inteiro gerado simplesmente alimentando o script em uma GAN. Não só isso, cada pessoa poderia usar aplicativos interativos simples para criar seus próprios filmes (possivelmente até mesmo estrelando a si mesmos!). Essa tecnologia seria o fim da fotografia, direção e atuação reais?

Tecnologia impressionante também significa um uso potencial para propósitos iníquos. Imagens perfeitamente falsas também exigirão meios para identificá-las e detectá-las. A regulação dessa geração de imagens seria necessária. Atualmente, as GANs já estão sendo usadas para a criação de vídeos falsos ou “Deepfakes”, que estão sendo usados ​​de maneira negativa, como gerar vídeos pornográficos falsos de celebridades ou apresentar pessoas dizendo coisas sem o conhecimento deles. As consequências de tornar a tecnologia para sintetizar a geração de áudio e vídeo disponível para a população em geral são assustadoras.

A geração de imagens artificiais é uma tecnologia de dois gumes, especialmente em uma época em que pouco é amplamente conhecido. Redes Adversariais Generativas são uma ferramenta tremendamente útil e também perigosa. O fato de que isso irá remodelar o mundo da tecnologia é certo, mas como isso acontecerá, só podemos refletir.

O fotojornalismo está morrendo?

O fotojornalismo está morrendo?

Eu li em algum lugar recentemente que o fotojornalismo não está morrendo, mas o modelo de distribuição mudou. O que isso significa? Como alguém que costumava trabalhar como fotógrafo editorial na Escócia, eu quis escrever algumas idéias sobre se o fotojornalismo está ou não, na sua forma mais crua, morrendo.

Em 2012, comecei a trabalhar como fotógrafo editorial para Gordon Jack e sua agência scotimage.com. Gordon me deu meu primeiro trabalho fotográfico já pago – em um estúdio – enquanto eu estava no meu último ano de faculdade em 2009. Ele mais tarde me adicionou como diretor do estúdio e eu comecei a me aventurar no mundo da fotografia de casamento.

Eu queria estudar fotografia porque era fascinado por fotógrafos como Henri Cartier-Bresson, Robert Capa, Eddie Adams e James Nachtwey, e eu queria ser capaz de contar histórias visuais como elas faziam em suas fotografias. Até agora, isso não está muito certo, mas eu sabia que queria seguir uma carreira em fotografia editorial, em vez de estar em um estúdio. Gordon ouviu meus gritos e decidiu me dar uma chance de trabalhar ao lado dele no mundo da mídia. Ele por acaso era (provavelmente) o melhor fotógrafo editorial da Escócia e era alguém que não tinha problemas em compartilhar o que conheciam – uma raridade na mídia de hoje, e uma das muitas razões pelas quais agora ele sente muita falta.

Encontrando sucesso

Trabalhar como fotógrafo editorial significava um novo emprego todos os dias, o que parece divertido – e era -, mas também significava que eu estava constantemente buscando histórias. Passei muito tempo no Twitter, ouvindo rádio local, acordando de manhã e imaginando que história poderia reunir em um determinado dia. Foi divertido, estressante, com um pouco de loucura. Eu ainda vejo e ouço coisas que me fazem pensar “que faria um grande conjunto de fotos”. Hoje em dia eu nunca encontrei tempo para seguir a história, ou talvez eu tenha ficado com preguiça?

Foi em 2012 que comecei a ter fotos apresentadas regularmente nos jornais nacionais sob o slogan da scotimage, mas 2014 foi o ano de maior sucesso neste negócio. Eu tirei um número recorde de fotos naquele ano e acho que ainda não correspondi. Você pode ver um monte de minhas fotos editoriais publicadas ao longo dos anos (de 2013 a 2015) aqui.

Meu show “mais bem pago” foi quando decidi ir ao prédio do Parlamento Escocês em Edimburgo, no dia da votação no referendo escocês. Foi um dia histórico e eu estou feliz por estar lá para testemunhar a empolgação apreensiva. As fotos tornaram-se mais populares depois do evento devido à forma como a votação foi dividida. A geração mais velha votou a maioria como “não”, enquanto a geração mais jovem votou a maioria como “sim” e assim a história foi contada nessas duas fotos:

Este foi provavelmente o último grande evento que eu cobri. Eu estava trabalhando para um fabricante de câmeras a partir de junho daquele ano e, em última análise, que pagava melhor, então comecei a perder tempo para encontrar esse tipo de história. Eu realmente sinto falta disso. Mas, para ser honesto, acho que seria quase impossível ganhar a vida como fotógrafo editorial na Escócia agora – a menos que você já esteja estabelecido. Por quê? Bem, depois dessa grande digressão, isso me leva à minha pergunta e ao propósito deste artigo: o fotojornalismo está morrendo?

Uma mudança de direção ou a queda?

A leitura tradicional de revistas e jornais está sempre em declínio, com algumas publicações sendo agora totalmente digitais ou simplesmente não sobrevivendo. Por sua vez, isso significa que os anunciantes estão se retirando de anúncios tradicionais de revistas e, em vez disso, usando plataformas de mídia social ou de conteúdo. Então, essas publicações que estão indo digital ainda enfrentam uma grande perda no dinheiro dos anunciantes. Com tudo isso em mente, isso criou um grande impacto na indústria fotográfica. O mundo efêmero em que vivemos agora, onde as notícias são produzidas mais rapidamente do que nunca, significa que é muito mais fácil para os “repórteres de smartphones” tirarem fotos em um instante – ao contrário de uma publicação que contrata um fotógrafo para fazer o trabalho. Isso é ignorância? Provavelmente um pouco. Mas o dinheiro fala e, para corporações / publicações, quando é um caso de poder versus bondade, o poder sempre prevalece. Então, como vimos brutalmente acontecer em 2015/16, as publicações cortaram seus fotógrafos da equipe. Todos eles. Um dos refugiados de sorte do fotojornalismo tradicional é a National Geographic.

Por que devemos nos preocupar em proteger o fotojornalismo? A mídia está em movimento rápido e leva a um mundo pós-verdade, no qual afirmações são feitas para jogar com emoções sem qualquer conexão com fatos do mundo real. O fotojornalismo tem a capacidade de nos desacelerar apenas o suficiente para que possamos ter uma compreensão real novamente. O fotojornalismo é factual. É por isso que importa. Ou pelo menos parte do porquê é importante.

Coisas como o Twitter tornaram o jornalismo preguiçoso?
A fácil disponibilidade de fotos gratuitas agora pode nos fazer pensar como alguém poderia ganhar a vida como fotojornalista. Com que frequência você vê meios de comunicação perguntando às pessoas no Twitter se elas podem usar suas fotos … de graça? Mais frequentemente do que me deixa confortável. As mesmas fotos e a mesma informação parecem se regurgitar em cada fonte, o que aconteceu com o bom jornalismo? O jornalismo ficou com preguiça? Coisas como o Twitter tornaram o jornalismo preguiçoso? Tantas perguntas, tão poucas respostas.

Foto jornalismo vs foto ilustração

Olhando através de artigos para pesquisa sobre este post, eu encontrei a pura falta de qualquer fotojornalismo. É muito triste Parece haver uma falta real de investimento em fotojornalismo. Há uma abundância de ilustrações fotográficas – visuais para fazer as coisas parecerem bonitas, embora a maioria delas pareça imagens em estoque. O financiamento para fotojornalismo estilo reportagem de boa qualidade parece estar morto, e isso é um pouco preocupante. Quando foi a última vez que você viu uma foto-ensaio significativa em qualquer publicação (bar Nat Geo)? Provavelmente há muito tempo atrás. Por quê? Porque eles não são mais financiados. Nem mesmo pelos grandes tempos como Times e Telegraph.

Há um pequeno esnobismo ligado ao fotojornalismo agora. É ligado a esses fotógrafos que podem “pagar” por ser fotojornalistas e significa que as crianças pobres e nós, da classe trabalhadora, muitas vezes não conseguem encontrar o sucesso como fotojornalistas. Isso também é preocupante. Isso nos dá uma visão distorcida do mundo e pode contribuir para o nosso viés inconsciente. Pode prejudicar a diversidade e nos dar uma visão unilateral do mundo.

O que mudou?

Lembram-se dos dias em que um editor enviava seu fotógrafo de equipe a uma parte do país para tirar uma série de imagens, porque valorizavam sua interpretação para contar a história, que então seria publicada? Sim, isso não acontece mais. Em um nível alto, sabemos as razões: a era digital matando a indústria cinematográfica e a impressão digital também – mas quais são as ramificações disso? Os editores agora vasculham o Google Images e o Twitter ou encontram um fotógrafo no local em que precisam ser fotografados. Esse fotógrafo pode ser ótimo, mas, infelizmente, a probabilidade é de que provavelmente houve um comprometimento negativo na qualidade e no valor desse trabalho. Isso não é uma vergonha?

Agora podemos culpar a falta de dinheiro, como já mencionado, mas também existe uma atitude em relação a isso. Se os editores sabem que podem obter algo mais barato, tudo bem – e isso é em todos os conteúdos de mídia, não apenas nas fotos.

Sobre a desvalorização filosófica da fotografia, o fotojornalista David R. Winslow disse:

“Costumava ser sobre a visão do fotógrafo que você estava enviando. Não foi uma decisão final. Era sobre o calibre do jornalismo e o calibre da fotografia que estava sendo produzida.

Agora, estamos dispostos a aceitar o que pudermos comprar de alguém que já esteja lá. Não é sobre o calibre do jornalismo ou da fotografia. Isso é uma decisão do contador de feijão.

Você deveria ler a entrevista dele com o NY Times; cada resposta eu me encontrei dizendo “isso é tão verdade”.

Para dar uma impressão positiva sobre isso, poderíamos olhar para ele como fotojornalistas que finalmente estão livres da política dos jornais. O fotojornalismo é mais democrático agora do que nunca, porque os fotógrafos contam suas histórias como entidades libertas de jornais e revistas. Mas isso não torna financeiramente viável ser um fotojornalista profissional, certo? Ou isso? Talvez só precisemos trabalhar um pouco mais para buscar as plataformas de conteúdo que ainda valorizam nossas histórias?

Abrace a mudança

A fotógrafa documental Ilvy Njiokiktjien resume bem, enquanto observa a mudança, ela ainda vê o positivo:

“As atribuições mudaram, então as pessoas não necessariamente vão mandar você para algum lugar por meses para trabalhar em um projeto. Em geral, se você deseja trabalhar em projetos de longo prazo, também precisa investir dinheiro.

Quando as fotos de Don McCullin chegavam aos jornais, suas imagens seriam as notícias. Agora, se eu tirar uma foto no funeral de Nelson Mandela, por exemplo, há 300 outros fotógrafos por lá. Há tantas imagens que você nunca vai realmente filmar uma imagem icônica. Isso mudou muito. Você não é o único a fotografar – existem seus colegas e há pessoas com telefones.

Eu não acho que uma única imagem irá perder seu poder. Imagens únicas, para mim, são tão fortes – eu posso olhar para uma única imagem e nunca esquecê-la. Mas há novas formas de contar histórias – com telefones, com experiências on-line interativas e realidade virtual – por isso, é importante ver o que corresponde à história ”.

O guru da mídia social Richard Stacy disse:

“A revolução da mídia social… é toda sobre a separação da informação de seus meios de distribuição”.

Sendo uma pessoa meio cheia de vidro, eu gosto de tentar encontrar os pontos positivos, e acho que isso nos dá uma boa ideia.

Talvez precisemos olhar para isso de outra maneira. A internet é apenas uma fonte de distribuição, assim como a impressão. Agora podemos alcançar um público global por quase nenhum custo. Sim, a Internet desempenhou um papel importante no colapso da mídia impressa, mas não é importante para nós abraçar esse “novo” modo de distribuição em vez de desistir do fotojornalismo?

O fotojornalismo está morrendo?
Eu estou otimista dizendo não. Precisamos lembrar que o fotojornalismo é a saída de informações, seja em livros, jornais, revistas, na internet, etc. Essas são apenas fontes de distribuição para essa saída de informações. Para simplificar, os modos de distribuição estão mudando, mas isso não significa automaticamente a morte das fontes de informação. Os editores talvez precisem começar a valorizar as fontes de informação um pouco melhor novamente, mas isso não deve atrapalhar nossa profunda necessidade de contar histórias. Deveria?

Quais são seus pensamentos sobre o assunto?