Resumo
Em conjuntos grandes de dados, a integridade ou a “limpeza” dos dados é fundamental. Veja as melhores maneiras de corrigir os erros de codificação de caracteres mais comuns.
Os uploads em lote por CSV estão disponíveis para todos os clientes.
A LearnUpon recomenda a codificação de caracteres UTF-8 ao lidar com uploads em lote. É mais provável que seu arquivo carregado seja importado corretamente quando codificado em UTF-8, em vez de formatos ISO ou equivalentes.
Esses erros aparecem quando você faz upload de dados provenientes de várias fontes para criar e convidar usuários. Use os métodos descritos para verificar se seus dados estão “limpos” e remova os caracteres que causam erros.
Informações gerais
- Upload de usuários por arquivo CSV em lote
- Upload de usuário em lote: visão geral e opções explicadas
Salvar no formato UTF-8
Seja qual for a origem do arquivo CSV, sua primeira opção é salvar no formato UTF-8. Esse formato resolve a maioria dos erros e facilita a identificação dos problemas restantes.
Verifique a codificação em um editor de texto ou editor de código-fonte
A codificação de caracteres em um arquivo pode mudar sem o conhecimento dos criadores de conteúdo quando são usados processadores de texto. A alteração pode passar despercebida até você tentar fazer upload do arquivo na LearnUpon.
Para identificar essas alterações, você precisa visualizar seus dados em um editor de texto ou editor de código-fonte, por exemplo
- Notepad++: editor de código-fonte gratuito que funciona no ambiente Windows
- TextPad: editor de finalidade geral para arquivos de texto sem formatação para Windows
- Brackets: um editor de código-fonte aberto que funciona no Mac, Windows e Linux
- Abra seu arquivo .CSV em um editor de texto e verifique a codificação na parte inferior da janela.
- Se a codificação não estiver definida como UTF-8, localize os controles de codificação no editor de texto.
- Defina a codificação como UTF-8.
- Salve o arquivo para concluir.
Observação: a marca de ordem de byte (BOM) pode ter um efeito negativo na codificação de caracteres para uploads em lote. A LearnUpon recomenda que você codifique em UTF-8 sem BOM.
A captura de tela a seguir mostra a borda de uma janela do Brackets com suas informações de codificação.
Dica: leia como salvar arquivos CSV com codificação UTF-8 em diferentes aplicativos de planilha.
A LearnUpon não é responsável por conteúdo fora deste site.
Caracteres extras e “invisíveis”
Aplicativos como o Microsoft Word/Excel podem adicionar formatação extra aos dados da qual você pode não estar ciente. Abra seu arquivo CSV em um editor de texto e procure
- caracteres extras adicionados aos dados
- formatações estranhas introduzidas como caracteres extras de vírgula “,”
- caracteres invisíveis: use “mostrar invisíveis” para visualizar caracteres adicionais, como dados binários
Verificar se há espaços em branco
Ao criar suas listas de usuários, esteja ciente de que o espaço em branco é considerado um caractere durante o processo de upload.
Espaços em branco são espaços entre palavras e caracteres individuais. A maioria das palavras tem um único espaço entre elas.
Os leitores humanos visualizam esses espaços como uma lacuna, mas o processamento de texto os interpreta como um caractere. Portanto, você deve remover espaços em branco em locais indevidos de suas listas.
johnsmith@acmetraining.com,
johnsmith@acmetraining.com ,
Para fins de processamento de upload em lote, esses dois endereços são diferentes, pois um tem um espaço em branco entre ele e a vírgula.
Se o espaço mostrado não for produzido pela ação de pressionar a barra de espaço e for um espaço em branco binário, isso poderá gerar uma falha no upload de usuários em lote, pois o espaço em branco será tratado como um caractere próprio.
A LearnUpon pode “capturar” e remover alguns caracteres de espaço em branco, mas às vezes você precisa removê-los manualmente usando um editor de texto.
Linhas “vazias”
Certifique-se de que a sua planilha não tenha linhas “vazias”: abra a planilha em um editor de texto e elimine quaisquer linhas com dados “vazios”.
Consulte: