1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.

"Хитрое" кодирование в pdf

Тема в разделе "Софт", создана пользователем faceless, 30.10.11.

  1. faceless

    faceless Активный участник

    8.070
    16
    Поскольку подобной темы не нашел, если только обратные задачи, придется создать новую.

    Проблема такова: есть текст в формате .doc. Нужно перегнать его в pdf, но с одним обязательным условием - при копировании текст не должен попасть назад в doc-формат. Пусть там будут иероглифы или другие проблемы для пользователя.

    Встречал в сети программу антиплагиат. Так там чтобы защитить от копирования предлагают, в том числе, смену шрифтов (например буквы "о" с русской на англ).
    Может быть использовать акробат на албанском языке, что-бы он не распознал русский язык?

    Как поступить в моем случае?
    Кто что может посоветовать? Или отправьте куда-нить почитать.
     
  2. Алек :) ГЫ

    Алек :) ГЫ Читатель

    6.651
    2
    что значит назад в doc формат? это будет просто текст. безо всяких шрифтов.

    посоветую не заниматься глупостями. кому сильно будет нужно - распечатают и распознают (совершенно клинический вариант конечно). да и нереально это (идея).
     
  3. faceless

    faceless Активный участник

    8.070
    16
    это значит назад в ворд.


    для вас может и глупости.


    я не прошу 100-процентной защиты.
    Я хочу трудностей при копировании назад в doc-формат.
     
  4. Алек :) ГЫ

    Алек :) ГЫ Читатель

    6.651
    2
    faceless, а в rtf, txt и другие форматы - не важно?

    еще раз: не занимайтесь глупостями.
     
  5. Digger34

    Digger34 Активный участник

    3.833
    980
    faceless, запретить ctrl+c и ctrl+v в пдфе можно, запретить распечатку тоже, но запретить открыть пдф в файнридере и распознать не выйдет. Даже если в жпег перегоните и потом в пдф, то от файнридера это не спасет :gigi:
     
  6. WooDy_Forester

    WooDy_Forester Активный участник

    2.849
    5
    даже пароль поставите-сломается под прогой
    защитить pdf-очень и очень тяжело
     
  7. Digger34

    Digger34 Активный участник

    3.833
    980
    Тогда просто запретите копирование текста, программ с такими функциями для создания пдф в сети навалом, но это совершенно не защитит от тех, у кого есть хотя бы зачатки мозга и желание этот текст скопировать:d
     
  8. ab7

    ab7 Активный участник

    3.247
    18
    Задача - чайников обломать? Так просто включите соответствующую опцию о запрете копирования при создании пдфа. Ну а продвинутые при желании всегда смогут достать текст разными способами, вплоть, действительно, до OCR.
     
  9. lange

    lange Активный участник

    11.682
    695
    "Перед прочтением - сжечь"©
     
  10. nosferatos

    nosferatos Читатель

    31.520
    2
    значит есть у меня одна знакомая...в то славное время готовилась она писать кандидатскую на какие-то умные юридические темы, но не суть. для данной диссертации из ленинской библиотеки было куплено ряд кандидатских и докторских а дальше...звезда в шоке, все началось с того что поломался принтер, который я собственно и приехал сделать, сделал и увидел: распечатывался текст pdf, потом печатался в ворде. тут я решил оптимизировать процесс, при помощи сканирования распечатанного, благо сканер имелся, но чЁта там беда какая-то с дровами была, решил у Умного человека спросить совета. Умный человек, выслушав всю историю, минуты 2 ржал, а потом рассказал мне о возможности finereader распознавать pdf...видели бы вы как та девушка была счастлива :d:d:d
    ps счас мировая судья, видать не зря совет пришелся :d
     
  11. WooDy_Forester

    WooDy_Forester Активный участник

    2.849
    5
    интересно какой год?) я думал,что уникальные возможности fineriderа извлекать текст известны даже школьнику, которому лень что то набирать с листка=)
     
  12. nosferatos

    nosferatos Читатель

    31.520
    2
    не помню точно, еще карты смартс были по 100 рублей.
     
  13. faceless

    faceless Активный участник

    8.070
    16
    Алек :) ГЫ, спасибо за ваши советы, учту.:)


    Digger34,
    WooDy_Forester,
    Digger34,
    ab7, я вас прекрасно понимаю, но уточняю вопрос. Мне не нужно ставить пароль, запрет копирования и пр. пр.

    мне нужно что бы при копировании-сканировании-распознавании, в тексте были ошибки. Т.е. что бы было не один в один с исходным текстом.

    Документ 500 листов, включает рисунки, графики, таблицы.

    Скажите, просто, без комментариев, встречал кто-то такое?

    Или ссылку дайте, где почитать. :shuffle:
     
  14. nosferatos

    nosferatos Читатель

    31.520
    2
    faceless, проще оставить стилистические ошибки и неверные определения, заведомо ложные, их внутренний словарь не засечет.
     
  15. Digger34

    Digger34 Активный участник

    3.833
    980
    Копирование запретить проще, ошибки при сканировании и распознавании и так неизбежны в некотором количестве, особенно при наличии диаграмм, графиков, таблиц и рисунков.

    Вы себе сами как представляете то возможность обмануть OCR? ну напишите часть текста от руки или ноги врачебным почерком, часть желтыми буквами на белом фоне, часть иероглифами на китайском :gigi: Только вот кто это будет читать в таком то виде? А иначе если если это будет нормально читаемый печатный текст от OCR вы никак не защититесь. Единственный верный способ - не давать этот текст никому ни в каком виде:spider:

    ---------- Сообщение добавлено 31.10.2011 18:04 ----------

    Если там 500 листов с графиками и таблицами, то 1 в 1 в любом случае не будет, потребует правки основательной для того чтоб привести в состояние 1 в 1.
     
  16. faceless

    faceless Активный участник

    8.070
    16
    вот это-то и проблема. :(

    Но в любом случае, спасибо
    Digger34,

    Мне дискуссия не помешает. Может кто-то натолкнет на мысль. :)

    ---------- Сообщение добавлено 31.10.2011 19:12 ----------

    не, ну это совсе не вариант. Исходник должен быть без ошибок.:writer:
     
  17. Digger34

    Digger34 Активный участник

    3.833
    980
    Как вариант привести текст в какой-нибудь вот такой вид, но честно говоря на месте того, кому вы эти 500 страниц даете читать, я бы вас пристрелил за такое :gigi:
     
  18. Куклачёв

    Куклачёв Читатель

    967
    0
    faceless,
    Воспользуйтесь бесплатным RMS сервисом, спите спокойно и никуда ничего не перегоняйте.
    [ame]http://www.youtube.com/watch?v=e_1dmxM-GWw[/ame]
     
  19. faceless

    faceless Активный участник

    8.070
    16
    Куклачёв, хорошая штука.
    А без привязки с интернет-сервису файл можно открыть?
    А то из ролика непонятно.
     
  20. Digger34

    Digger34 Активный участник

    3.833
    980
    Как я понял нет, но способ какой никакой) Хотя от принтскрина и OCR не защитит в полной мере, но 500 листов маловероятно что кто-то осилит отпринтскринить и распознать, ну ежели только очень сильно не заморочиться и не автоматизировать процесс :gigi:
     
  21. Slavok3336

    Slavok3336 Участник

    129
    0
    Простая защита от дураков, отсканируйте нужный вам текст и создайте pdf файл из фотографий. Скопировать точно ни кто не сможет обычным копи-пастом. Придется распознавать))
     
  22. Digger34

    Digger34 Активный участник

    3.833
    980
    Slavok3336, я смотрю вы не ищете легких путей :iq:
     
  23. faceless

    faceless Активный участник

    8.070
    16
    да я и не претендую. Я прекрасно понимаю, что файл будет открыт/скопирован/отформатирован и пр. Просто хочу чтобы он отличался от исходника.


    да, способ, хорош в принципе, но вот привязка к интернету.:(

    ---------- Сообщение добавлено 31.10.2011 23:18 ----------

    а может его можно и не перегонять в этот формат?

    Может что-то другое можно использовать?
     
  24. Digger34

    Digger34 Активный участник

    3.833
    980
    Ну "что-то другое" и было предложено Куклачёвым, за минусом привязки к серверу способ неплохой в общем-то.
     
  25. Slavok3336

    Slavok3336 Участник

    129
    0

    на 500 страниц, соглашусь он не расчитан:)

    ---------- Сообщение добавлено 31.10.2011 22:43 ----------

    как вариант перевода .doc в .jpeg. http://www.print-driver.ru/howto/convert_word_to_jpeg.htm
     
  26. WooDy_Forester

    WooDy_Forester Активный участник

    2.849
    5
    а какбы водные знаки поставить вариант?или копирайт тут не при чём?
     
  27. RedFraer

    RedFraer Активный участник

    1.420
    5
    Оставить в формате «.doc» но что бы при отключенном макросе лист ворда текст не содержал. Написать на VBA (возможно с использованием WIN API) макрос, который:
    1. вставляет текст в лист ворда
    2. блокирует возможность печати документа
    3. перехватывает буфер клавиатуры в случае копирования и заменяет содержимое желаемой фразой
    4. блокирует возможность пересохранить файл с вставленным в лист ворда текстом
    5. перехватывает принт-скрин и отчищает его
    6. при закрытии ворда блокирует вопрос на сохранение файла и просто закрывает ворд

    Что-то подобное я встречал в .CHM файлах

    ---------- Сообщение добавлено 02.11.2011 00:39 ----------

    Правда есть нюанс. Пароли VBA хранятся в файле ворда в незашифрованном виде, а потому пытливый ум найдет, как выдернуть текст. По крайней мере, это так до офиса 2003 включительно, не знаю, закрыли ли мелкомягкие эту дырку в новых версиях офиса.

    ---------- Сообщение добавлено 02.11.2011 00:43 ----------

    Кстати «.pdf» тоже поддерживает какие-то макросы, но я не в курсе, что они представляют и можно ли на них это реализовать.

    ---------- Сообщение добавлено 02.11.2011 00:50 ----------

    Если уж писать макрос то вообще можно это реализовать через написание отдельной программы. Которая бы показывала текст в виде картинки, текст с которой нельзя скопировать и выдернуть каким ни будь WIN API функционалом. Программа бы отчищала автоматом принт-скрин и не позволяла печатать текст. Сам текст в теле программы можно разместить в порядке неудобном для копирования скажем через какой ни будь HEX редактор.

    ---------- Сообщение добавлено 02.11.2011 00:57 ----------

    Можно даже сам текст, хранить не в теле программы, а хранить в зашифрованном виде в отдельном файле. А в программе хранить только ключ к расшифровке. А можно даже ключом к расшифровке сделать, например комбинацию серийного номера материнской платы, серийного номера жесткого диска и сида пользователя. Тогда вы еще привяжете файл к конкретному компьютеру, который сможет запуститься только под определенным пользователем. В общем, предел фантазии может ограничить только знания программиста и его финансовая заинтересованность.

    ---------- Сообщение добавлено 02.11.2011 01:00 ----------

    Если же файл следует куда-то отправлять, то ключом к расшифровке может стать выданный Вами для них ключевой файл или же пароль. Или же вариант активации программы как это сейчас модно делать.

    ---------- Сообщение добавлено 02.11.2011 01:02 ----------

    Но есть программы, которые могут скопировать картинку из окна программы, минуя принт-скрин, и все их предусмотреть, не получится. Так что платить за подобную разработку серьезного смысла не вижу.
     
    Последнее редактирование: 02.11.11
  28. faceless

    faceless Активный участник

    8.070
    16
    не заметил ваш ответ во-время. Тоже хорош, но читать такое конечно не айс. :)


    я не спорю. Но там нельзя сделать чтобы было одноврменно печать и запрет копирования. Там что-то одно должно быть.


    щас попробую. :)

    ---------- Сообщение добавлено 02.11.2011 22:25 ----------

    вот. То, о чем я мечтал. :shuffle: Где про это можно почитать?


    Не-е, нужно чтобы файл был один. Ну, например, отослал я человеку, свой документ, он почитал, распечатал и... все. дальше конец. Пусть сканирует.:)
    не-е так сложно не нужно.

    Что-нибуть по-проще. Я не в работаю в мин обороны и пр. структурах :)
     
  29. qwertEHOK

    qwertEHOK Активный участник

    3.093
    57
    вы бы рассказали от кого прятать то нужно?
    если это чайник дубовый то достаточно пароль на пдф

    что за текст? стоит его прятать\защищать? стоят эти 500 листов того что бы х дней сидеть и в ручную переписывать?
     
  30. faceless

    faceless Активный участник

    8.070
    16
    или кто даст/продаст?

    ---------- Сообщение добавлено 02.11.2011 22:38 ----------

    Все большое спасибо за "мозговой штурм". Можно еще предложения выдвигать :)