Concatenação e Codificação de SMS
Closum
Last Update há 8 meses
Introdução
A utilização correta do SMS Marketing exige compreender a importância da adoção adequada no mesmo. Este que conta com duas codificações, a Codificação GSM e a Codificação Unicode, a utilização das mesmas depende do conjunto de caracteres usados para escrever a mensagem.
Resumo
O seguinte resumo é uma forma abreviada de interpretação.
Para conhecer todos os detalhes sobre concatenação e codificação, consulte o artigo na íntegra.
Codificação GSM- Limite de 160 caracteres por mensagem; suporta apenas um conjunto limitado de caracteres alfanuméricos comuns, excluído símbolos, emojis, caracteres especiais.
Codificação Unicode- Limite de 70 caracteres por mensagem; permite representação de uma vasta gama de de caracteres, incluindo símbolos, emojis e caracteres especiais, sendo ideal para idiomas não latinos e mensagens multilíngues.
Codificação GSM
A Codificação GSM, que significa Sistema Global para Comunicações Móveis, é amplamente utilizada para a transmissão de mensagens de texto em telemóveis. Este suporta um conjunto limitado de caracteres alfanuméricos, incluindo letras, números e alguns símbolos especiais.
O Closum suporta todos os caracteres GSM padrão assim como os caracteres GSM da tabela extendida.
Esta otimização resulta numa maior economia de recursos de rede, o que permite uma transmissão de dados mais rápida.
Os caracteres padrão ocupam 7 bits por caracter para codificação e são os seguintes:
Os caracteres da tabela a seguir, tabela extendida, necessitam de dois caracteres para serem codificados: um prefixo de caracter ESC seguido pelo caracter obrigatório da tabela extendida:
A principal vantagem da codificação GSM no SMS Marketing é a eficiência de transmissão e um maior número de caracteres por SMS e um maior limite de caracteres por SMS. As mensagens são representadas em 7 bits, ocupando menos espaço e consumindo menos recursos da rede.
Além disso, a codificação GSM é amplamente suportada por dispositivos móveis e operadoras de telecomunicações no mundo inteiro. Isso garante que as mensagens de texto sejam recebidas corretamente na maioria dos casos.
Como resultado, a codificação GSM não suporta todos os caracteres existentes noutros sistemas de codificação mais abrangentes, como o Unicode.
Codificação Unicode
A Codificação Unicode é um padrão universal que abrange a maioria dos sistemas de escrita do mundo. Foi projetado para ser capaz de representar todos os caracteres existentes, independentemente do idioma ou sistema de escrita. Utiliza códigos numéricos únicos para cada caracter, permitindo a representação de mais de 1 milhão de caracteres diferentes.
Por exemplo, alfabetos como o Árabe, Chinês, Coreano, Japonês e Cirílico ou a utilização de emojis requer codificação Unicode. Estes caracteres devem ser considerados de 16 bits UCS-2.
Quando a mensagem é utilizada como Unicode, todos os caracteres na mesma são codificados utilizando UCS-2, mesmo aqueles que estão presentes no conjunto de caracteres padrão GSM.
Exemplos de codificação:
Mensagem | Tipo | Bytes por caracter | Total de bytes necessários | Conjunto de caracteres utilizados no SMS |
bonjour monde | Texto | 1 | 13 | Padrão GSM |
Isto ^ Aquilo | Texto | 1 (2 para ^ como está no conjunto de caracteres extendidos) | 14 | GSM padrão e GSM aceitável |
こんにちは世界 | Unicode | 2 (UCS-2) | 14 | Unicode |
A principal vantagem da codificação Unicode no SMS Marketing é a sua capacidade de alcançar um público global e oferecer suporte a uma ampla variedade de idiomas. As empresas podem enviar mensagens personalizadas e localizadas para diferentes regiões, o que é fundamental para campanhas de marketing internacional.
Além disso, através da utilização de emojis e de todos os caracteres especiais, permite transmitir mensagens mais visuais e dinâmicas criando mais interação com a audiência.
Número máximo de caracteres
O comprimento máximo de uma única mensagem SMS é de 140 bytes. O que equivale a 160 caracteres GSM padrão de 7 bits ou 70 caracteres UCS-2 de 16 bits, numa codificação Unicode.
Uma mensagem mais longa do que estes valores será dividida em partes diferentes, portanto, por cada parte do SMS é cobrado um custo.
Partes | Máximo de caracteres | Cálculo |
1 | 160 | Sem UDH, 160 carateres estão disponíveis |
2 | 304 | (160 - 7) * 2 = 306 |
3 | 456 | (160 - 7) * 3 = 459 |
4 | 608 | (160 - 7) * 4 = 612 |
Se está a enviar uma mensagem em Unicode então cada caracter na mensagem irá ocupar 2 bytes.
O Closum aceita SMS até 3200 caracteres mas nem todas as operadoras aceitam. Para manter uma boa prática evite enviar mensagens que excedam 6 partes.
Conclusão
A codificação GSM oferece a eficiência de transmissão e o suporte universal, sendo uma escolha adequada para mensagens de texto simples e informações básicas. Por outro lado, o Unicode oferece versatilidade, permitindo que as empresas alcancem um público global e transmitam mensagens personalizadas em diferentes idiomas bem como a utilização de emojis e caracteres especiais tornando a mensagem mais dinâmica e visual.
A escolha da adoção de SMS Marketing depende do público-alvo, dos recursos de suporte do sistema e do conteúdo da mensagem. É importante considerar as vantagens e necessidades específicas de cada situação para garantir a entrega adequada e a compreensão das mensagens pelos destinatários.