ݺߣ

ݺߣShare a Scribd company logo
Методи, методики та техніки аналізу тексту
                                             Концептуально-                   Загальна
                                      теоретичне підґрунтя             мета
       Контент-аналіз — метод                Соціальні теорії, перш           Висновки
(методологія) отримання надійних за все — теорія комунікації.          щодо      соціальної
та валідних висновків з текстів в            Текст — певна з реальності, з якою
соціальному        контексті       їх функціонально-смислового         змістовно
використання        з     допомогою погляду упорядкована група пов’язаний текст.
інтерсуб’єктивно         узгоджених висловлювань або їх аналогів,
правил систематизації інформації.     які являють собою завдяки
                                      семантичним                    і
                                      функціональним
                                      взаємовідношенням елементів
                                      завершену смислову єдність.
                                      Текст в широкому розумінні:
                                      писемний      текст,    аудіо-,
                                      відеозаписи, зображення і т.д.
       Якісний контент-аналіз — методика аналізу текстів шляхом систематичної
інтерпретації текстів через виділення в них тем, тенденцій і відповідне їх кодування.
       Комп’ютеризований контент-аналіз (computer-aided content analysis) — техніка
кодування текстів з використанням комп’ютерних засобів для систематизованого запису
результатів роботи кодувальника (аналітика).
 Кількісний аналіз текстових даних




            Кількісний контент-аналіз — методика аналізу текстів шляхом кількісного
     порівняння аналітичних категорій через підрахунок ключових слів (чи інших
     одиниць рахунку).
            Автоматизований контент-аналіз (computer-assisted content analysis) — техніка
     автоматизованого кодування текстів та підрахунку в них ключових слів (чи інших
     одиниць рахунку) з допомогою комп’ютерних засобів.
            Текст-майнінг — (1)              Теорії обчислювальної            Висновки
     набір технік для виявлення в лінгвістики. Текст як дані — щодо
     текстових                 даних цілісні послідовності символів інформаційних
     нетривіальних тенденцій, які (літер, цифр, знаків пунктуації паттернів               в
     можуть зацікавити дослідника; і т.д.), які разом з метаданими текстових даних.
     (2)         міждисциплінарний містять змістовну інформацію.
     напрямок досліджень, що
     охоплює методики обробки
     інформації,          машинного
     навчання,          статистичної
     класифікації, роботи з базами
     даних та ін., які можуть бути
     застосовані до тексту.
            Аналіз природної мови            Формальні теорії мови            Забезпеченн
     (natural language processing) — та штучного інтелекту. Текст я               взаємодії
     міждисциплінарна          галузь без теоретично навантаженого людських
     науки, що охоплює методики контексту.                             комунікативних
     обчислювальної лінгвістики та                                     актів (вербальних
     теорії штучного інтелекту.                                        та невербальних) та
                                                                       комп’ютерних
                                                                       систем.
Література:
        1. Лисенко С. М. Розробка та дослідження алгоритмів інтелектуальної обробки
текстів (text mining) / С. М. Лисенко // Наукові праці [Текст] : наук.-метод. журн. —
Миколаїв : ЧДУ ім. П. Могили, 2011. — Вип. 148. — С. 80 – 88.
        2. Семотюк О. Комп’ютерний контент-аналіз: основні завдання, сфери
застосування, переваги та недоліки / О. Семотюк // Вісник Львівського університету.
Серія журналістики. — 2004. — Вип. 25. — С. 397 – 401.
        3. Павлишенко Б. М. Групування текстових даних на основі моделі семантичного
контексту / Б. М. Павлишенко // Восточно-Европейский журнал передовых технологий.
Информационные технологии. — 2011. — № 5/2 (53). — С. 39 – 42.
        4. Бондар В. С., Допіра М. А. Розгляд методу контент-аналізу з погляду кількісно-
якісних технік проведення / В. С. Бондар, М. А. Допіра // Наукові записки НаУКМА. —
К.: Національний університет «Києво-Могилянська академія», 2007. — Т. 70,
«Соціологічні науки». — С. 17–26.
        5. Соціологія: Навчальний посібник / С. О. Макеєв (ред.). — К.: «Українська
енциклопедія» ім. М. П. Бажана, 1999. — С. 175.
        6. Neuendorf, K. The Content Analysis Guidebook / Kimberly Neuendorf. — Thousand
Oaks, CA: Sage Publications, 2002. — P. 9.
        7. The American Heritage Dictionary of the English Language. — Houghton Mifflin
Company, 2009. — P. 1027.
        8. Методологические и методические проблемы контент-анализа: тезисы докладов
рабочего совещания социологов / Андрей Григорьевич Здравомыслов (Ред.). — М.:
Институт социологических исследований Академии наук СССР, 1973. — Т. 1 — С. 19.
        9. Новейший философский словарь / А.А. Грицанов (Ред.). — Мн.: Книжный Дом,
2003. — С. 628.
        10. Krippendorff K. Content analysis : an introduction to its methodology / Klaus
Krippendorff. — Thousand Oaks : Sage Publications, Inc., 2004.
        11. Одинцов В.В. Стилистика текста. — М.: Наука, 1980. — С. 45.
        12. Pfütze M. Grundgedanken zu einer funktionalen Textlinguistik / Max Pfütze //
Textlinguistik, 1970. — №. 1. — S. 1–15.
        13. Іванов О.В. Кількісний контент-аналіз: проблема контексту / О. В. Іванов //
Вісник Харківського національного університету імені В. Н. Каразіна. Серія: Соціологічні
дослідження сучасного суспільства : методологія, теорія, методи ; вип. 30 — Харків:
Харківський національний університет ім. В.Н. Каразіна, 2012. — № 999. — С. 95–99.
        14. Kromrey H. Empirische Sozialforschung. Modelle und Methoden der standardisierten
Datenerhebung und Datenauswertung / Helmut Kromrey. — Stuttgart: Lucius & Lucius Verlag,
2006. — S. 212.
        15. Weber R. P. Basic content analysis. / Robert Philip Weber — Newbury Park, CA:
Sage, 1963. — Р. 49 – 69.
        16. Language of Politics: Studies in Quantitative Semantics / Harold D. Lasswell, Nathan
Leites (Eds.). — Cambridge, Mass.: MIT Press, 1949. — P. 40–52.
        17. Romanowski M. What you don’t know can hurt you: Textbook omissions and 9/11 /
Michael H. Romanowski // Clearing House, 2009. — №. 82. — P. 290–296.
        18. Bos W., Tarnai C. Content analysis in empirical social research / Wilfried Bos,
Christian Tarnai // International Journal of Educational Research. — 1999. — № 31. — Р. 668.
        19. Deichsel, A. Elektronische Inhaltsanalyse. Zur quantitativen Beobachtung
sprachlichen Handelns. / Alexander Deichsel. — Berlin, 1975.
        20. Züll C., Mohler P. Textanalyse. Anwendungen der computerunterstützten
Inhaltsanalyse / Cornelia Züll, Peter Mohler. — Opladen: Westdeutscher Verlag, 1992. — S.
155–184.
21. Tan, A. H. Text mining: the state of the art and the challenges / Ah-Hwee Tan //
Proceedings of the PAKDD workshop on knowledge discovery from advanced databases. —
Beijing, 1999. — Р. 65–70.
        22. Chomsky N. Three models for the description of language / Noam Chomsky // IEEE
Transactions on Information Theory. — 1956. — Vol. 2, № 3. — P. 113—124.
        23. Bates M. Models of natural language understanding / Madeleine Bates // Proceedings
of the National Academy of Sciences of the United States of America. — 1995. — Vol. 92, №
22. — P. 9977—9982.
        24. Laver M. Extracting policy positions from political texts using word as data / Michael
Laver, Kenneth Benoit , Garry John // American Political Science Review. — 2003. — V. 97
(2). — P. 311 – 331.
        25. Riffe D., Freitag A. A content analysis of content analyses: 25 years of Journalism
Quarterly / Daniel Riffe, Alan Freitag // Journalism & Mass Communication Quarterly. — 1997.
— V. 74. — P. 873 – 882.
        26. BarYossef Z., Gurevich M. Random Sampling from a Search Engine’s Index
[Електронний ресурс] / Ziv BarYossef, Maxim Gurevich // Journal of the ACM. — 2008. — V.
55 (5). — Режим доступу: http://www2006.org/programme/files/pdf/3047.pdf.

More Related Content

Методи, методики та техніки аналізу тексту

  • 1. Методи, методики та техніки аналізу тексту Концептуально- Загальна теоретичне підґрунтя мета Контент-аналіз — метод Соціальні теорії, перш Висновки (методологія) отримання надійних за все — теорія комунікації. щодо соціальної та валідних висновків з текстів в Текст — певна з реальності, з якою соціальному контексті їх функціонально-смислового змістовно використання з допомогою погляду упорядкована група пов’язаний текст. інтерсуб’єктивно узгоджених висловлювань або їх аналогів, правил систематизації інформації. які являють собою завдяки семантичним і функціональним взаємовідношенням елементів завершену смислову єдність. Текст в широкому розумінні: писемний текст, аудіо-, відеозаписи, зображення і т.д. Якісний контент-аналіз — методика аналізу текстів шляхом систематичної інтерпретації текстів через виділення в них тем, тенденцій і відповідне їх кодування. Комп’ютеризований контент-аналіз (computer-aided content analysis) — техніка кодування текстів з використанням комп’ютерних засобів для систематизованого запису результатів роботи кодувальника (аналітика). Кількісний аналіз текстових даних Кількісний контент-аналіз — методика аналізу текстів шляхом кількісного порівняння аналітичних категорій через підрахунок ключових слів (чи інших одиниць рахунку). Автоматизований контент-аналіз (computer-assisted content analysis) — техніка автоматизованого кодування текстів та підрахунку в них ключових слів (чи інших одиниць рахунку) з допомогою комп’ютерних засобів. Текст-майнінг — (1) Теорії обчислювальної Висновки набір технік для виявлення в лінгвістики. Текст як дані — щодо текстових даних цілісні послідовності символів інформаційних нетривіальних тенденцій, які (літер, цифр, знаків пунктуації паттернів в можуть зацікавити дослідника; і т.д.), які разом з метаданими текстових даних. (2) міждисциплінарний містять змістовну інформацію. напрямок досліджень, що охоплює методики обробки інформації, машинного навчання, статистичної класифікації, роботи з базами даних та ін., які можуть бути застосовані до тексту. Аналіз природної мови Формальні теорії мови Забезпеченн (natural language processing) — та штучного інтелекту. Текст я взаємодії міждисциплінарна галузь без теоретично навантаженого людських науки, що охоплює методики контексту. комунікативних обчислювальної лінгвістики та актів (вербальних теорії штучного інтелекту. та невербальних) та комп’ютерних систем.
  • 2. Література: 1. Лисенко С. М. Розробка та дослідження алгоритмів інтелектуальної обробки текстів (text mining) / С. М. Лисенко // Наукові праці [Текст] : наук.-метод. журн. — Миколаїв : ЧДУ ім. П. Могили, 2011. — Вип. 148. — С. 80 – 88. 2. Семотюк О. Комп’ютерний контент-аналіз: основні завдання, сфери застосування, переваги та недоліки / О. Семотюк // Вісник Львівського університету. Серія журналістики. — 2004. — Вип. 25. — С. 397 – 401. 3. Павлишенко Б. М. Групування текстових даних на основі моделі семантичного контексту / Б. М. Павлишенко // Восточно-Европейский журнал передовых технологий. Информационные технологии. — 2011. — № 5/2 (53). — С. 39 – 42. 4. Бондар В. С., Допіра М. А. Розгляд методу контент-аналізу з погляду кількісно- якісних технік проведення / В. С. Бондар, М. А. Допіра // Наукові записки НаУКМА. — К.: Національний університет «Києво-Могилянська академія», 2007. — Т. 70, «Соціологічні науки». — С. 17–26. 5. Соціологія: Навчальний посібник / С. О. Макеєв (ред.). — К.: «Українська енциклопедія» ім. М. П. Бажана, 1999. — С. 175. 6. Neuendorf, K. The Content Analysis Guidebook / Kimberly Neuendorf. — Thousand Oaks, CA: Sage Publications, 2002. — P. 9. 7. The American Heritage Dictionary of the English Language. — Houghton Mifflin Company, 2009. — P. 1027. 8. Методологические и методические проблемы контент-анализа: тезисы докладов рабочего совещания социологов / Андрей Григорьевич Здравомыслов (Ред.). — М.: Институт социологических исследований Академии наук СССР, 1973. — Т. 1 — С. 19. 9. Новейший философский словарь / А.А. Грицанов (Ред.). — Мн.: Книжный Дом, 2003. — С. 628. 10. Krippendorff K. Content analysis : an introduction to its methodology / Klaus Krippendorff. — Thousand Oaks : Sage Publications, Inc., 2004. 11. Одинцов В.В. Стилистика текста. — М.: Наука, 1980. — С. 45. 12. Pfütze M. Grundgedanken zu einer funktionalen Textlinguistik / Max Pfütze // Textlinguistik, 1970. — №. 1. — S. 1–15. 13. Іванов О.В. Кількісний контент-аналіз: проблема контексту / О. В. Іванов // Вісник Харківського національного університету імені В. Н. Каразіна. Серія: Соціологічні дослідження сучасного суспільства : методологія, теорія, методи ; вип. 30 — Харків: Харківський національний університет ім. В.Н. Каразіна, 2012. — № 999. — С. 95–99. 14. Kromrey H. Empirische Sozialforschung. Modelle und Methoden der standardisierten Datenerhebung und Datenauswertung / Helmut Kromrey. — Stuttgart: Lucius & Lucius Verlag, 2006. — S. 212. 15. Weber R. P. Basic content analysis. / Robert Philip Weber — Newbury Park, CA: Sage, 1963. — Р. 49 – 69. 16. Language of Politics: Studies in Quantitative Semantics / Harold D. Lasswell, Nathan Leites (Eds.). — Cambridge, Mass.: MIT Press, 1949. — P. 40–52. 17. Romanowski M. What you don’t know can hurt you: Textbook omissions and 9/11 / Michael H. Romanowski // Clearing House, 2009. — №. 82. — P. 290–296. 18. Bos W., Tarnai C. Content analysis in empirical social research / Wilfried Bos, Christian Tarnai // International Journal of Educational Research. — 1999. — № 31. — Р. 668. 19. Deichsel, A. Elektronische Inhaltsanalyse. Zur quantitativen Beobachtung sprachlichen Handelns. / Alexander Deichsel. — Berlin, 1975. 20. Züll C., Mohler P. Textanalyse. Anwendungen der computerunterstützten Inhaltsanalyse / Cornelia Züll, Peter Mohler. — Opladen: Westdeutscher Verlag, 1992. — S. 155–184.
  • 3. 21. Tan, A. H. Text mining: the state of the art and the challenges / Ah-Hwee Tan // Proceedings of the PAKDD workshop on knowledge discovery from advanced databases. — Beijing, 1999. — Р. 65–70. 22. Chomsky N. Three models for the description of language / Noam Chomsky // IEEE Transactions on Information Theory. — 1956. — Vol. 2, № 3. — P. 113—124. 23. Bates M. Models of natural language understanding / Madeleine Bates // Proceedings of the National Academy of Sciences of the United States of America. — 1995. — Vol. 92, № 22. — P. 9977—9982. 24. Laver M. Extracting policy positions from political texts using word as data / Michael Laver, Kenneth Benoit , Garry John // American Political Science Review. — 2003. — V. 97 (2). — P. 311 – 331. 25. Riffe D., Freitag A. A content analysis of content analyses: 25 years of Journalism Quarterly / Daniel Riffe, Alan Freitag // Journalism & Mass Communication Quarterly. — 1997. — V. 74. — P. 873 – 882. 26. BarYossef Z., Gurevich M. Random Sampling from a Search Engine’s Index [Електронний ресурс] / Ziv BarYossef, Maxim Gurevich // Journal of the ACM. — 2008. — V. 55 (5). — Режим доступу: http://www2006.org/programme/files/pdf/3047.pdf.