En PDF är inte som en utskriven sida. Under ytan är den ett strukturerat dokument med separata lager — text, bilder, anteckningar. Det innebär att en svart ruta på skärmen inte alltid tar bort texten under. UnRedact kontrollerar om så är fallet — men hittar ingenting om maskningen är korrekt genomförd.
Problemet: klisterlappen
När text maskas i ett PDF-dokument görs det ibland fel. Istället för att ta bort texten på riktigt läggs en svart rektangel ovanpå texten — som en klisterlapp. Texten bakom finns kvar, orörd, i dokumentets struktur.
Vad UnRedact gör
UnRedact läser dokumentets textlager direkt — utan att passera genom det visuella lagret. Om texten finns kvar i filstrukturen kan den läsas. Om den är borttagen på riktigt finns inget att hitta, och verktyget rapporterar inga fynd.
Tre typer av maskningar
Anteckningsbaserad — En svart kommentar eller rektangelannotation klistrad ovanpå texten. Vanligast i digitalt skapade PDF:er. Texten kan läsas och annotationen kan tas bort helt.
Ritad form — En svart form ritad direkt i dokumentets innehållsström. Texten kan fortfarande läsas, men formen kan inte automatiskt tas bort vid export.
Skannad PDF — Dokumentet är en fotograferad eller skannad bild. Det finns ingen text i filstrukturen att hämta. Maskeringen kan inte avslöjas — och UnRedact talar om när detta är fallet.
Konfidensgradering
Inte alla fynd är lika säkra. UnRedact graderar varje kandidat:
- Hög konfidens — En svart anteckning av typen "Redact" eller fylld svart rektangel direkt ovanpå text. Nästan säkert en maskning.
- Medel konfidens — En svart ritad form täcker text, men kan i sällsynta fall vara ett designelement som en tabellkant.
- Låg konfidens — En mörkgrå (men inte helsvart) form täcker text. Bedöm själv.
Vad UnRedact inte kan göra
- Korrekt maskad text går inte att återfå. Om texten faktiskt tagits bort från PDF-strukturen finns inget att hitta. Ett tomt resultat kan alltså betyda att maskningen är korrekt — inte nödvändigtvis att dokumentet är fritt från maskningar.
- Skannade dokument fungerar inte. Om PDF:en är ett foto eller en scan existerar texten som bildpunkter. UnRedact kan inte läsa bilder och flaggar detta tydligt.
- Verktyget ger ofta falska positiva. Svarta tabellkanter, logotyper och designelement kan misstolkas som maskningar. Alla fynd måste granskas manuellt — behandla resultatet som ett underlag, inte som ett facit.
- Delvis avslöjad text. Verktyget plockar ut textobjekt som överlappar med en mörk yta, men kan missa text om koordinaterna inte stämmer exakt, eller om dokumentet använder ovanliga fontformat.
Varför är det säkert att använda?
Din fil lämnar aldrig din enhet. All bearbetning sker lokalt i webbläsaren — ingen server tar emot, lagrar eller loggar ditt dokument. Sidan hämtar en analysmotor från servern vid laddning, men efter det skickas ingenting ut. Du kan verifiera detta i webbläsarens nätverksflik (DevTools → Network): ingen trafik ska ske när du laddar upp och analyserar en fil. Källkoden är öppen och granskningsbar.