CODECS
Codec - IMAGEM
Há 3 tipos de formatos que os e-readers podem suportar: JPEG, GIF e PNG. O tamanho das imagens, nestes dispositivos, é importante, pois quanto menor, pior é a qualidade e imagens de baixa qualidade dificultarão a leitura do leitor e intrepretação do leitor. As imagens utilizadas nos livros digitais, devem ser coloridas mesmo que, de momento, a maioria dos e-readers utilize e-ink a preto e branco. Esta tecnologia permite representar imagens com 16 tons de cinzento, apesar de as cores não aparecerem, as nuances e o contraste são visíveis, contudo já há aparelhos, à venda, com tecnologia e-ink a cores, onde possibilita ao utilizador distinguir os vários tons.
​
Nos tablets é possível visualizar a imagem a cores, pois os seus ecrãs utilizam outro tipo de tecnologia.
A JPEG standard tem como principais requisitos:
​
-
Eficiência;
-
Baixa complexidade;
-
Aplicável a qualquer tipo de imagem;
-
Capacidade de ajustar o trade-off entre a qualidade e a eficiência de compressão.
​Durante a compressão, tem duas fases importantes como Data Model e Entropy Encoder.
​
No Data model:
​
-
Obtém-se símbolos a partir de PCM samples;
-
Elimina irrelevância e redundância espacial;
-
Temos DCT (Discrete Cossine Transform): ​​
-
Cada coeficiente desta matriz corresponde a uma determinada frequência;
-
Baseia-se na interpretação espectral, esta tem em conta o sistema visual humano, pois os nossos olhos são mais sensíveis a baixas frequências do que às altas.
-
Reversível para permitir o retorno ao domínio espacial;
-
Transforma o domínio espacial no domínio da frequência, pois, este apresenta menos redundância espacial;
-
-
Temos Quantização:
-
​Processo Lossless;
-
Reduz a irrelevância e redundância espectral, pois elimina informação contida nas altas frequências da matriz DCT que não são percetíveis ao olho humano;
-
Quanto menor é a taxa de compressão, maior é a qualidade da imagem.
-
O segundo encoder, Entropy Encoder, tem em conta a distribuição estatística dos símbolos e, a partir disso, é possível obter um código constituído por bits, permitindo minimizar a taxa de transmissão. A passagem para bits é possível recorrendo-se a run-length coding e Huffman Code.
​
A representação do Codec para JPEG encontra-se representado na imagem seguinte:
​
JPEG deve oferecer vários modos de operação, tais como:
​
-
Sequential mode: cada componente da imagem é codificado de cima para baixo e da esquerda para a direita;
​​
-
Progressive mode: componetes são codificados em sucessivos “scans”, em que os primeiros criam uma versão aproximada da imagem, os restantes scans melhoram a sua qualidade;
​
-
Hierarchical mode: imagem apresentada incialmnete é de baixa resolução, e os sucessivos “scans” permitem uma melhoria na imagem por aumentarem a sua resolução;
​​
-
Lossless mode: neste método não ocorre perda de qualidade, preservando a imagem original, ao contrário dos restantes. Principalmente usado em imagens médicas.
​​
Enquanto o JPEG sacrifica a qualidade em imagens de tamanho inferior, o PNG prioriza a qualidade e comprime as imagens sem que haja perdas. Este codec permite que as imagens sejam guardadas várias vezes sem perderem qualidade. No processo de compressão utiliza DEFLATE, um algoritmo de compressão de dados que combina LZ77 e Huffman.
O formato GIF, é utilizado para representar animações. Permite apenas 256 cores, sendo bastante limitado relativamente aos restantes. Contudo, apresenta uma compressão melhor que o JPEG. As imagens neste formato são comprimidas utilizando uma técnica sem perdas, Lempel-Ziv-Welch (LZW), reduzindo assim o tamanho do arquivo, sem degradar a qualidade visual.
Codec - Audio
Os audiobooks podem ter dois formatos: MP3 (MPEG 1/2 Layer 3) ou Advanced Audio Coding (AAC). Ambos comprimem ficheiros de áudio com perdas com o AAC a atingir, geralmente, melhor qualidade de som para a mesma taxa de bits. Esta diferença de qualidade é mais notória para taxas de bits menos elevadas, sendo que, para taxas altas, a eficiência do codificador não tem tanta relevância. O modo de operação de ambos os codecs é semelhante, recorrendo à Modifed Discret Cossine Transform (MDCT), onde passam do domínio do tempo para o da frequência e o sinal é quantizado, tendo em conta o modelo psicoacústico.
A partir deste modelo, é possível saber quais os sinais que podem ser eliminados, quer seja por estarem abaixo do limite da capacidade auditiva dos humanos, quer seja por estarem “escondidos” por outro sinal mais forte numa frequência próxima. Apesar de o formato MP3 estar a ficar ultrapassado, ainda é muito usado neste tipo de aparelhos. Um arquivo AAC será superior em qualidade e terá um tamanho menor que um MP3, oferecendo mais canais e uma largura de frequência de amostragens maior.
​
Codec - Vídeo
Alguns e-readers têm a capacidade reproduzir vídeos em alta definição, graças à funcionalidade do codificador MPEG-4 AVC/H.264, sendo este o mais presente nos dispositivos atualmente. Este codificador permite compactar vídeos com a mesma qualidade do MPEG-2, reduzindo a taxa de compressão em 50%. As etapas que diferenciam este codec dos anteriores são:
​
-
Estimação e compensação de movimento: a imagem é dividida em blocos de tamanho variável, com uma precisão de ¼ pixel
​​
-
Intra prediction: para cada macro bloco, é explorada a redundância espacial nos blocos adjacentes, na mesma imagem, aumentando a eficiência
​​
-
Decisão de modos: o codificador vai definir quais os modos de predição que deve utilizar, de acordo com o conteúdo da imagem, definindo também qual deve ser a divisão do macro bloco para estimação e compensação de movimentos
De forma a evitar a baixa qualidade dos vídeos em dispositivos de baixa resolução, foi adicionada a extensão Scalable Video Coding (SVC) ao codificador H.264. Esta recorre à codificação em camadas, de forma hierárquica e estável, onde cada camada oferece uma resolução de vídeo melhor, relativamente à anterior, permitindo que cada uma ofereça uma resolução diferente.
​
A representação deste codec é a seguinte: