Salvar como PDF, Imprimir para PDF, ou os dois? Um olhar de segurança sobre a conversão de documentos Word

Converter um documento Word em PDF parece uma operação trivial — dois cliques e pronto. Mas quando o documento em questão contém informação sensível (um parecer para cliente, uma evidência de auditoria, um relatório de incidente), a escolha entre "Salvar como PDF" e "Imprimir para PDF" deixa de ser cosmética e vira uma decisão de segurança. E, em alguns cenários, a resposta certa é fazer os dois.

O que cada opção realmente faz

As duas opções produzem um arquivo .pdf no final, mas o caminho que elas percorrem é fundamentalmente diferente — e é nesse caminho que mora a diferença de segurança.

O Salvar como PDF (ou Exportar como PDF) do Word faz uma conversão estrutural: ele lê o XML interno do DOCX e traduz cada elemento para o equivalente em PDF. Parágrafos viram blocos de texto pesquisáveis, títulos viram bookmarks, hyperlinks permanecem clicáveis, tabelas mantêm estrutura lógica, e metadados do documento são preservados (geralmente como XMP dentro do PDF). O resultado é um PDF rico, funcional e acessível — mas que carrega consigo muita coisa que o autor talvez não quisesse distribuir.

O Imprimir para PDF (via Microsoft Print to PDF, Adobe PDF Printer, PDFCreator ou similar) não sabe nada sobre o documento original. Ele recebe apenas o que o Word envia ao pipeline de impressão do Windows: uma sequência de páginas renderizadas como comandos de desenho. O driver transforma isso em um PDF que é, em essência, uma fotocópia digital — visualmente idêntico, mas desprovido de estrutura lógica.

Essa diferença de arquitetura é a raiz de tudo que vem a seguir.

O que sobra quando você só "Salva como PDF"

Mesmo desmarcando as opções avançadas no diálogo de exportação do Word (propriedades do documento, marcas de revisão, texto oculto, tags de estrutura), o PDF gerado pode conter:

  • Metadados XMP e do dicionário Info — autor, empresa, software de criação, datas, e às vezes caminhos de rede ou nomes de usuário.
  • Comentários e revisões não aceitas — se você esqueceu de aceitar ou rejeitar track changes antes de exportar, eles podem virar anotações no PDF.
  • Texto formatado como oculto — continua presente no PDF, apenas invisível ao renderizador padrão; copiar-e-colar o revela.
  • Hyperlinks e ações de URI — úteis, mas também vetores potenciais para phishing ou exfiltração silenciosa.
  • JavaScript embutido — raro em documentos Word, mas pode aparecer via add-ins ou templates contaminados.
  • Camadas ocultas (Optional Content Groups) — conteúdo presente no arquivo mas não renderizado por padrão.
  • Objetos embutidos e form fields — planilhas, anexos, campos de formulário que carregam dados estruturados.

Para a maioria dos documentos internos, nada disso é problema. Para documentos que vão sair da organização, cada item desses é uma potencial fuga de informação.

O que o "Imprimir para PDF" elimina naturalmente

Como o print-to-PDF opera apenas sobre o que é efetivamente renderizado, ele descarta por construção:

  • Qualquer metadado estruturado do DOCX original.
  • Comentários, revisões, texto oculto (o que não é renderizado não vira pixel).
  • JavaScript, ações de URI, form actions.
  • Camadas ocultas e OCGs.
  • Anexos embutidos e objetos OLE.
  • Bookmarks e estrutura de navegação.

Em troca, você perde funcionalidades legítimas: hyperlinks clicáveis, sumário navegável, tags de acessibilidade, conformidade com PDF/A para arquivamento de longo prazo.

Vale notar que o print-to-PDF não é sanitização completa. O driver de impressão adiciona seus próprios metadados (data, usuário Windows, nome da máquina), e não remove esteganografia embutida em imagens ou watermarks visuais. Mas, como filtro de conteúdo estrutural, ele é bastante eficaz.

Quando fazer os dois faz sentido

Combinar as duas etapas — salvar como PDF e depois imprimir esse PDF para um novo PDF — cria uma sanitização em dois estágios com mecanismos independentes. Cada passo remove uma categoria diferente de resíduo:

  1. O primeiro passo (Save as PDF com opções restritas) descarta a maior parte dos artefatos do DOCX: metadados do Office, comentários, texto oculto, custom XML parts.
  2. O segundo passo (Print to PDF) descarta os artefatos do próprio PDF: metadados XMP, bookmarks, JavaScript, camadas, form fields, referências internas a conteúdo removido.

O ganho prático:

  • Defesa em profundidade contra conteúdo ativo. Se o PDF intermediário ficou com JavaScript ou ações URI (por contaminação de template, por exemplo), o segundo passe destrói tudo.
  • Quebra de referências estruturais residuais. O XML do DOCX às vezes mantém ponteiros para conteúdo "deletado" que ainda vive no pacote. O print reconstrói o documento só a partir do output visual.
  • Checkpoint auditável. Você pode inspecionar o PDF intermediário com exiftool, pdfinfo ou pdf-parser antes de aplicar o segundo passe, confirmando que a sanitização funcionou.

O custo: você perde hyperlinks navegáveis, TOC clicável, tags de acessibilidade e conformidade PDF/A. Para documentos rotineiros, é overhead desnecessário. Para documentos que vão para reguladores, clientes externos ou terceiros não-confiáveis, é uma camada extra de garantia que custa pouco e agrega bastante.

Um fluxo prático para documentos sensíveis

Antes de exportar qualquer coisa, passe o documento pelo Inspetor de Documento do Word (Arquivo → Informações → Verificar Problemas → Inspecionar Documento). Essa ferramenta nativa do Office já remove a maioria dos metadados e conteúdo oculto — e fazer isso antes da exportação é muito mais eficaz do que tentar limpar o PDF depois.

Em seguida, a decisão depende do destino do arquivo:

Para documentos internos ou que precisam manter acessibilidade e navegação, use Salvar como PDF com as opções restritas (desmarque propriedades do documento, marcas de revisão, texto oculto) e, se for arquivamento de longo prazo, ative PDF/A.

Para documentos que vão sair da organização e não precisam de interatividade, use o fluxo duplo: salve como PDF, inspecione o resultado com exiftool -a -G1 arquivo.pdf para confirmar que os metadados estão limpos, e então imprima esse PDF para gerar a versão final distribuível.

Para documentos de altíssima sensibilidade onde você quer garantia destrutiva máxima, converta o PDF para imagens raster (pdftoppm seguido de img2pdf) — nada de texto, estrutura ou metadado sobrevive. O custo é alto (o arquivo fica maior, não é pesquisável, quebra acessibilidade), mas para certos contextos é o único nível aceitável de sanitização.

Conclusão

"Salvar como PDF" e "Imprimir para PDF" não são duas formas de fazer a mesma coisa — são duas ferramentas com perfis de risco diferentes. A primeira preserva estrutura, a segunda preserva apenas aparência. Para a maioria dos documentos, a primeira é a escolha certa. Para documentos sensíveis, a segunda oferece sanitização natural. Para os casos em que você quer o melhor dos dois mundos — estrutura auditável no meio do caminho e flattening no final —, combinar as duas é um controle compensatório simples, barato e eficaz.

Segurança de documentos raramente é sobre uma única ferramenta perfeita. É sobre entender o que cada passo do seu fluxo preserva, o que descarta, e onde você quer colocar os checkpoints.

Postagens mais visitadas