Копулы и моделирование зависимости: косвенные оценки интенсивности рискованного поведения
Аннотация
В условиях ограниченности ресурсов наиболее доступным способом получения информации о поведении индивида является интервью. В этом случае данные о недавнем поведении индивида наименее подвержены различным типам смещения. Для построения оценки интенсивности поведения по данным о трех последних эпизодах используются математические модели поведения. В работе рассмотрена гамма-пуассоновская модель поведения. Зависимость двух интервалов между последовательными эпизодами в этой модели описана в терминах копул. Оценка параметра копулы в этом случае напрямую ведет к оценке параметров распределения интенсивности поведения в популяции. Кроме того, вид копулы позволяет определить некоторые характеристики поведения, описываемого гамма-пуассоновской моделью: кластеризованность эпизодов поведения. Возможности предложенного подхода продемонстрированы на модельных данных.
Литература
P. 43. URL: https://doi.org/10.3390/econometrics4040043 (дата обращения 09.06.2018).
2. El Adlouni S., Beaulieu C., Ouarda T. B., Gosselin P. L., Saint-Hilaire A. Effects of climate on West Nile
Virus transmission risk used for public health decision-making in Quebec // International journal of
health geographics. 2007. № 6(1). P. 40. doi: 10.1186/1476-072X-6-40
3. Alsina C., Schweizer B., Frank M. J. Associative functions: triangular norms and copulas. Singapoure:
World Scientific, 2006.
4. Baek S. A Copula-Based Method for Analyzing Bivariate Binary Longitudinal Data // Publicly
Accessible Penn Dissertations 1564, 2016. URL: http://repository.upenn.edu/edissertations/1564 (дата обращения 09.06.2018).
5. Balakrishnan N., Lai C. D. Continuous bivariate distributions // Springer Science & Business Media,
2009. 684 p.
6. Bargagli A. M., Hickman M., Davoli M., Perucci C. A., Schifano P., Buster M., Brugal T., Vicente J. Drugrelated mortality and its impact on adult mortality in eight European countries // The European
Journal of Public Health. 2005. № 16(2). P. 198–202. doi: 10.1093/eurpub/cki168
7. Bellamy S. L., Baek S., Troxel A. B., Ten Have T. R., Jemmott J. B. A copula approach to estimate
reliability: an application to self-reported sexual behaviors among HIV serodiscordant couples //
Statistics and Its Interface. 2016. № 9(1). P. 57–67. doi: 10.4310/SII.2016.v9.n1.a6
8. Bell D. C, Trevino R. A. Modeling HIV Risk [Epidemiology] // JAIDS. 1999. Vol. 22(3). P. 280–287. doi:
10.1097/00126334-199911010-00010
9. Bennett A. K. Older age underwriting: frisky vs frail // Journal of Insurance Medicine. 2004. № 36(1).
P. 74–83.
10. Bobak M., Malyutina S., Horvat P., Pajak A., Tamosiunas A., Kubinova R., Simonova G., Topor-Madry R.,
Peasey A., Pikhart H., Marmot M.G. Alcohol, drinking pattern and all-cause, cardiovascular and
alcohol-related mortality in Eastern Europe // European Journal of Epidemiology. 2016. Vol. 31, № 1.
P. 21–30. URL: https://doi.org/10.1007/s10654-015-0092-8 (дата обращения 09.06.2018)..
11. Cameron A.C., Li T., Trivedi P. K., Zimmer D .M. Modelling the differences in counted outcomes using
bivariate copula models with application to mismeasured counts // The Econometrics Journal. 2004.
№ 7(2). P. 566–584. doi: 10.1111/j.1368-423X.2004.00144.x
12. Chen L., Singh V. P., Shenglian G., Hao Z., Li T. Flood coincidence risk analysis using multivariate copula functions // Journal of Hydrologic Engineering. 2011. № 17(6). P. 742–755. doi:
10.1061/(ASCE)HE.1943-5584.0000504
13. Clayton D. G. A model for association in bivariate life tables and its application in epidemiological
studies of familial tendency in chronic disease incidence // Biometrika. 1978. № 65(1). P. 141–151. doi:
10.1093/biomet/65.1.141
14. De Michele C., Salvadori G. A generalized Pareto № 108(D2). P. 1-–11. doi: 10.1029/2002JD002534
15. Favre A. C., El Adlouni S., Perreault L., Thiemonge A., Bobee B. Multivariate hydrological frequency
analysis using copulas // Water resources research. 2004. № 40(1). P. W01101. URL: doi:10.1029/
2003WR002456 (дата обращения 09.06.2018)..
16. Grimaldi S., Serinaldi F. Design hyetographs analysis with 3-copula function // Hydrological Scientific
Journal. 2006. № 51(2). P. 223-–238. doi: 10.1623/hysj.51.2.223
17. Hargreaves J. R., Delany–Moretlwe S., Hallett T. B., Johnson S., Kapiga S., Bhattacharjee P., Dallabetta G.,
Garnett G. P. The HIV prevention cascade: integrating theories of epidemiological, behavioural, and
social science into programme design and monitoring // The Lancet HIV, 2016. № 3(7). P. e318–e322.
URL: https://doi.org/10.1016/S2352-3018(16)30063-7 (дата обращения 09.06.2018).
18. Jiang H., Fine J. P., Kosorok M. R., Chappell R. Pseudo self-consistent estimation of a copula model with
informative censoring // Scandinavian Journal of Statistics. 2005. № 32(1). P. 1–20. doi: 10.1111/j.1467-
9469.2005.00412.x
19. Kao S. C., Govindaraju R. S. A bivariate frequency analysis of extreme rainfall with implications for
design // Journal of Geophysical Research. 2007. № 112(D1). P. 113–119. doi: 10.1029/2007JD008522
20. Karmakar S., Simonovic S. P. Bivariate flood frequency analysis. Part 2: A copula-based approach
with mixed marginal distributions // Journal of Flood Risk Management. 2009. № 2(1). P. 32-–44. doi:
10.1111/j.1753-318X.2009.01020.x
21. Kurowicka D., Joe H. (eds.) Dependence modeling: vine copula handbook. World Scientific Publishing
Co, 2011. 370 p. doi: 10.1142/7699
22. Kuss O., Hoyer A., Solms A. Meta-analysis for diagnostic accuracy studies: a new statistical model
using beta-binomial distributions and bivariate copulas // Statistics in medicine, 2014. № 33(1). P. 17–
30. doi: 10.1002/sim.5909
23. Louzada F., Suzuki A. K., Cancho V. G., Prince F. L., Pereira G. A. The long-term bivariate survival
FGM copula model: an application to a brazilian HIV Data // Journal of Data Science. 2012. № 10(3).
P. 511–535.
24. Mikosch T. Copulas: Tales and facts // Extremes. 2006. № 9. P. 3–20. URL: https://doi.org/10.1007/
s10687-006-0015-x (дата обращения 09.06.2018).
25. Mucha L., Stephenson J., Morandi N., Dirani R. Meta-analysis of disease risk associated with smoking,
by gender and intensity of smoking // Gender medicine. 2006. N№ 3(4). P. 279–291. URL: https://doi.
org/10.1016/S1550-8579(06)80216-0 (дата обращения 09.06.2018).
26. Nelsen R. B. An introduction to Copulas, second edition. Springer series in Statistics, 2006. 272 p. doi:
10.1007/0-387-28678-0
27. Nikoloulopoulos A. K. A mixed effect model for bivariate meta-analysis of diagnostic test accuracy
studies using a copula representation of the random effects distribution // Statistics in medicine. 2015.
№ 34(29). P. 3842–3865. doi: 10.1002/sim.6595
28. Oakes D. Bivariate survival models induced by frailties // Journal of the American Statistical
Association. 1989. № 84(406). P. 487–493. doi: 10.1080/01621459.1989.10478795
29. Renard B., Lang M. Use of a Gaussian copula for multivariate extreme value analysis: Some
case studies in hydrology // Advances in Water Resources. 2007. № 30(4). P. 897–912. doi:
10.1016/j.advwatres.2006.08.001
30. Sallis J. F., Owen N., Fotheringham M. J. Behavioral epidemiology: a systematic framework to classify
phases of research on health promotion and disease prevention // Annals of Behavioral Medicine.
2000. № 22(4). P. 294–298. doi: 10.1007/BF02895665
31. Salvadori G., De Michele C. On the use of copulas in hydrology: theory and practice // Journal of
Hydrologic Engineering. 2007. № 12(4). P. 369–380. doi: 10.1061/(ASCE)1084-0699(2007)12:4(369)
32. Shi Q., Sargent D. J. Meta-analysis for the evaluation of surrogate endpoints in cancer clinical trials //International journal of clinical oncology. 2009. № 14(2). P. 102–111. doi: 10.1007/s10147-009-0885-4
33. Siettos C. I., Russo L. Mathematical modeling of infectious disease dynamics // Virulence. 2013. № 4(4).
P. 295–306. doi: 10.4161/viru.24041
34. Shiau J. T., Wang H. Y., Chang T. T. Bivariate frequency analysis of floods using copulas // Journal
of American Water Resources Association. 2006. № 42(6). P. 1549—1564. doi: 10.1111/j.1752-
1688.2006.tb06020.x
35. Shih J. H., Louis T. A. Inferences on the association parameter in copula models for bivariate survival
data // Biometrics. 1995. № 51. P. 1384–1399. doi: 10.2307/2533269
36. Shuper P. A., Joharchi N., Irving H., Rehm J. Alcohol as a correlate of unprotected sexual behavior
among people living with HIV/AIDS: review and meta-analysis // AIDS and Behavior. 2009. № 13(6).
P. 1021–1036. doi: 10.1007/s10461-009-9589-z
37. Tulupyev A., Suvorova A., Sousa J., Zelterman D. Beta prime regression with application to
risky behavior frequency screening // Statistics in medicine. 2013. № 32(23). P. 4044–4056. doi:
10.1002/sim.5820
38. Uusitalo L. Advantages and challenges of Bayesian networks in environmental modelling // Ecological
modelling. 2007. № 203(3–4). P. 312–318. doi: 10.1016/j.ecolmodel.2006.11.033
39. Warburton D. E., Nicol C. W., Bredin S. S. Health benefits of physical activity: the evidence // Canadian
medical association journal. 2006. № 174(6). P. 801–809. doi: 10.1503/cmaj.051351
40. Wienke A. Frailty models in survival analysis. CRC Press, 2010. 320 p.
41. Zaba B., Slaymaker E., Urassa M., Boerma J. T. The role of behavioral data in HIV surveillance // Aids.
2005. № 19. P. S39–S52. doi: 10.1097/01.aids.0000172876.74886.86
42. Zhang L., Singh V. P. Bivariate rainfall frequency distributions using Archimedean copulas // Journal
of Hydrology (Amsterdam), 2007. № 332(1–2). Pp. 93-–109. doi: 10.1016/j.jhydrol.2006.06.033
43. Zhang L., Singh V. P. Bivariate flood frequency analysis using the copula method // J. Hydrol. Eng.
2006. № 11(2). P. 150-–164. doi: 10.1061/(ASCE)1084-0699(2006)11:2(150)
44. International Actuarial Association A global framework for insurer solvency assessment. IAA Insurer
Solvency Assessment Working Party Research Report, 2004. URL: http://www.actuaries.org/LIBRARY/
Papers/Global_Framework_Insurer_Solvency_Assessment-public.pdf (доступ 09.06.2018).
45. Азаров А. А., Тулупьева Т. В., Суворова А. В., Тулупьев А. Л., Абрамов М. В., Юсупов Р. М. Социоинженерные атаки: проблемы анализа. СПб.: Наука, 2016. 349 с.
46. Абрамов М. В. Методы и алгоритмы анализа защищенности пользователей информационных систем от социоинженерных атак: оценка параметров моделей: дис. на соискание степени канд. тех. наук. Санкт-Петербург, СПИИРАН, 2018. 232 c. URL: http://www.spiiras.nw.ru/
dissovet/abramov/ (доступ 09.06.2018).
47. Благовещенский Ю. Н. Основные элементы теории копул // Прикладная эконометрика. 2012.
№ 2(26). С. 113–130.
48. Гнеденко Б. В. Курс теории вероятностей. 8-е издание. М.: Едиториал УРСС, 2005. 448 с.
49. Зельтерман Д., Суворова А. В., Пащенко А. Е., Мусина В. Ф., Тулупьев А. Л., Тулупьева Т. В., Красносельских Т. В., Гро Л. Е., Хаймер Р. Обработка систематической ошибки, связанной с длиной
временных интервалов между интервью и последним эпизодом в гамма-пауссоновской модели поведения // Труды СПИИРАН. 2011. Вып. 16. C. 160–185.
50. Пащенко А. Е., Тулупьев А. Л., Николенко С .И. Статистическая оценка вероятности заражения
ВИЧ-инфекцией на основе данных о последних эпизодах рискованного поведения // Труды
СПИИРАН. 2006. Вып. 3. Т. 2. C. 257–268.
51. Пащенко А. Е., Тулупьев А. Л., Тулупьева Т.В., Красносельских Т. В., Соколовский Е В. Косвенная оценка вероятности заражения ВИЧ-инфекцией на основе данных о последних эпизодах
рискованного поведения // Здравоохранение Российской Федерации. 2010. Вып. 2. C. 32–35.
52. Степанов Д. В., Мусина В. Ф., Суворова А. В., Тулупьев А. Л., Сироткин А. В., Тулупьева Т. В. Функция правдоподобия с гетерогенными аргументами в идентификации пуассоновской модели
рискованного поведения в случае информационного дефицита // Труды СПИИРАН. 2012. 4(23).
C. 157–184.
53. Столярова В. Ф. Виды и свойства попарной зависимости длин интервалов между последовательными эпизодами в пуассоновской и гамма–пуассоновской моделях поведения // IV Международная летняя школа–семинар по искусственному интеллекту для студентов, тов, молодых ученых и специалистов интеллектуальные системы и технологии: современное состояние и перспективы–2017 (ISYT–2017) г. Санкт-Петербург, 30 июня – 3 июля, 2017 г.
Сборник научных трудов. С. 160–167.
54. Суворова А. В., Тулупьев А. Л., Пащенко А. Е., Тулупьева Т. В., Красносельских Т. В. Анализ гранулярных данных и знаний в задачах исследования социально значимых видов поведения //
Компьютерные инструменты в образовании. 2010. № 4. C. 30–38.
55. Суворова А. В., Тулупьев А. Л., Сироткин А. В. Байесовские сети доверия в задачах оценивания
интенсивности рискованного поведения // Нечеткие системы и мягкие вычисления, 2014.
Т. 9. № 2. С. 115–129.
56. Тулупьев А. Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. СПб.: Наука, 2006. 607 с.
57. Тулупьев А. Л., Сироткин А. В., Николенко С. И. Байесовские сети доверия: логиковероятностный вывод в ациклических направленных графах. СПб.: Изд-во С.-Петерб. ун-та,
2009. 400 с.
58. Тулупьева Т. В., Пащенко А. Е., Тулупьев А. Л., Красносельских Т. В., Казакова О. С. Модели ВИЧрискованного поведения в контексте психологической защиты и других адаптивных стилей,
2008. 140 с.
59. Феллер В. Введение в теорию вероятностей и её приложения. Том 1, 2. М.: Мир, 1984. 528 c.,
752 с.
60. R Core Team. R: A language and environment for statistical computing, 2018. R Foundation for
Statistical Computing, Vienna, Austria. https://www.R-project.org/ (доступ 09.06.2018).
61. Hofert M., Kojadinovic I., Maechler M. Jun Yan copula: Multivariate Dependence with Copulas. R
package version 0.999-18. 2017. URL: https://CRAN.R-project.org/package=copula (дата обращения
09.06.2018).
62. Jun Yan Enjoy the Joy of Copulas: With a Package copula // Journal of Statistical Software.
2017. № 21(4). P. 1-21. URL: http://www.jstatsoft.org/v21/i04/ (дата обращения 09.06.2018). doi:
10.18637/jss.v021.i04
63. Kojadinovic I., Jun Yan Modeling Multivariate Distributions with Continuous Margins Using the
copula R Package // Journal of Statistical Software. 2010. № 34(9). P. 1–20. URL: http://www.jstatsoft.
org/v34/i09/ (дата обращения 09.06.2018).
Материал публикуется под лицензией: