Salvar como PDF, Imprimir para PDF, ou os dois? Um olhar de segurança sobre a conversão de documentos Word
Converter um documento Word em PDF parece uma operação trivial — dois cliques e pronto. Mas quando o documento em questão contém informação sensível (um parecer para cliente, uma evidência de auditoria, um relatório de incidente), a escolha entre "Salvar como PDF" e "Imprimir para PDF" deixa de ser cosmética e vira uma decisão de segurança. E, em alguns cenários, a resposta certa é fazer os dois.
O que cada opção realmente faz
As duas opções produzem um arquivo .pdf no final, mas o caminho que elas percorrem é fundamentalmente diferente — e é nesse caminho que mora a diferença de segurança.
O Salvar como PDF (ou Exportar como PDF) do Word faz uma conversão estrutural: ele lê o XML interno do DOCX e traduz cada elemento para o equivalente em PDF. Parágrafos viram blocos de texto pesquisáveis, títulos viram bookmarks, hyperlinks permanecem clicáveis, tabelas mantêm estrutura lógica, e metadados do documento são preservados (geralmente como XMP dentro do PDF). O resultado é um PDF rico, funcional e acessível — mas que carrega consigo muita coisa que o autor talvez não quisesse distribuir.
O Imprimir para PDF (via Microsoft Print to PDF, Adobe PDF Printer, PDFCreator ou similar) não sabe nada sobre o documento original. Ele recebe apenas o que o Word envia ao pipeline de impressão do Windows: uma sequência de páginas renderizadas como comandos de desenho. O driver transforma isso em um PDF que é, em essência, uma fotocópia digital — visualmente idêntico, mas desprovido de estrutura lógica.
Essa diferença de arquitetura é a raiz de tudo que vem a seguir.
O que sobra quando você só "Salva como PDF"
Mesmo desmarcando as opções avançadas no diálogo de exportação do Word (propriedades do documento, marcas de revisão, texto oculto, tags de estrutura), o PDF gerado pode conter:
- Metadados XMP e do dicionário Info — autor, empresa, software de criação, datas, e às vezes caminhos de rede ou nomes de usuário.
- Comentários e revisões não aceitas — se você esqueceu de aceitar ou rejeitar track changes antes de exportar, eles podem virar anotações no PDF.
- Texto formatado como oculto — continua presente no PDF, apenas invisível ao renderizador padrão; copiar-e-colar o revela.
- Hyperlinks e ações de URI — úteis, mas também vetores potenciais para phishing ou exfiltração silenciosa.
- JavaScript embutido — raro em documentos Word, mas pode aparecer via add-ins ou templates contaminados.
- Camadas ocultas (Optional Content Groups) — conteúdo presente no arquivo mas não renderizado por padrão.
- Objetos embutidos e form fields — planilhas, anexos, campos de formulário que carregam dados estruturados.
Para a maioria dos documentos internos, nada disso é problema. Para documentos que vão sair da organização, cada item desses é uma potencial fuga de informação.
O que o "Imprimir para PDF" elimina naturalmente
Como o print-to-PDF opera apenas sobre o que é efetivamente renderizado, ele descarta por construção:
- Qualquer metadado estruturado do DOCX original.
- Comentários, revisões, texto oculto (o que não é renderizado não vira pixel).
- JavaScript, ações de URI, form actions.
- Camadas ocultas e OCGs.
- Anexos embutidos e objetos OLE.
- Bookmarks e estrutura de navegação.
Em troca, você perde funcionalidades legítimas: hyperlinks clicáveis, sumário navegável, tags de acessibilidade, conformidade com PDF/A para arquivamento de longo prazo.
Vale notar que o print-to-PDF não é sanitização completa. O driver de impressão adiciona seus próprios metadados (data, usuário Windows, nome da máquina), e não remove esteganografia embutida em imagens ou watermarks visuais. Mas, como filtro de conteúdo estrutural, ele é bastante eficaz.
Quando fazer os dois faz sentido
Combinar as duas etapas — salvar como PDF e depois imprimir esse PDF para um novo PDF — cria uma sanitização em dois estágios com mecanismos independentes. Cada passo remove uma categoria diferente de resíduo:
- O primeiro passo (Save as PDF com opções restritas) descarta a maior parte dos artefatos do DOCX: metadados do Office, comentários, texto oculto, custom XML parts.
- O segundo passo (Print to PDF) descarta os artefatos do próprio PDF: metadados XMP, bookmarks, JavaScript, camadas, form fields, referências internas a conteúdo removido.
O ganho prático:
- Defesa em profundidade contra conteúdo ativo. Se o PDF intermediário ficou com JavaScript ou ações URI (por contaminação de template, por exemplo), o segundo passe destrói tudo.
- Quebra de referências estruturais residuais. O XML do DOCX às vezes mantém ponteiros para conteúdo "deletado" que ainda vive no pacote. O print reconstrói o documento só a partir do output visual.
- Checkpoint auditável. Você pode inspecionar o PDF intermediário com
exiftool,pdfinfooupdf-parserantes de aplicar o segundo passe, confirmando que a sanitização funcionou.
O custo: você perde hyperlinks navegáveis, TOC clicável, tags de acessibilidade e conformidade PDF/A. Para documentos rotineiros, é overhead desnecessário. Para documentos que vão para reguladores, clientes externos ou terceiros não-confiáveis, é uma camada extra de garantia que custa pouco e agrega bastante.
Um fluxo prático para documentos sensíveis
Antes de exportar qualquer coisa, passe o documento pelo Inspetor de Documento do Word (Arquivo → Informações → Verificar Problemas → Inspecionar Documento). Essa ferramenta nativa do Office já remove a maioria dos metadados e conteúdo oculto — e fazer isso antes da exportação é muito mais eficaz do que tentar limpar o PDF depois.
Em seguida, a decisão depende do destino do arquivo:
Para documentos internos ou que precisam manter acessibilidade e navegação, use Salvar como PDF com as opções restritas (desmarque propriedades do documento, marcas de revisão, texto oculto) e, se for arquivamento de longo prazo, ative PDF/A.
Para documentos que vão sair da organização e não precisam de interatividade, use o fluxo duplo: salve como PDF, inspecione o resultado com exiftool -a -G1 arquivo.pdf para confirmar que os metadados estão limpos, e então imprima esse PDF para gerar a versão final distribuível.
Para documentos de altíssima sensibilidade onde você quer garantia destrutiva máxima, converta o PDF para imagens raster (pdftoppm seguido de img2pdf) — nada de texto, estrutura ou metadado sobrevive. O custo é alto (o arquivo fica maior, não é pesquisável, quebra acessibilidade), mas para certos contextos é o único nível aceitável de sanitização.
Conclusão
"Salvar como PDF" e "Imprimir para PDF" não são duas formas de fazer a mesma coisa — são duas ferramentas com perfis de risco diferentes. A primeira preserva estrutura, a segunda preserva apenas aparência. Para a maioria dos documentos, a primeira é a escolha certa. Para documentos sensíveis, a segunda oferece sanitização natural. Para os casos em que você quer o melhor dos dois mundos — estrutura auditável no meio do caminho e flattening no final —, combinar as duas é um controle compensatório simples, barato e eficaz.
Segurança de documentos raramente é sobre uma única ferramenta perfeita. É sobre entender o que cada passo do seu fluxo preserva, o que descarta, e onde você quer colocar os checkpoints.