Установить / импортировать пакеты R в python с помощью rpy2, импортировать / игнорировать рассматриваемый пакет

1

Вот что я пытаюсь сделать:

  1. Я хочу использовать дискретный критерий пригодности по Колмогорову-Смирову, который в настоящее время доступен только в R. Кроме того, R также имеет нормальный тест KS - я не хочу использовать этот тест.
  2. Я пользователь Python, поэтому мне нужно перенести дискретный тест KS на python, для этого я пытаюсь использовать rpy2.

Проблема, с которой я сталкиваюсь, как описано здесь более подробно, состоит в том, что rpy2 похоже, заменяет импортированный дискретный тест стандартной версией. Я знаю это, потому что он не дает правильного ответа при тестировании.

Попытки пока

import rpy2.robjects.packages as r
utils = r.importr("utils")
package_name = "dgof"
utils.install_packages(package_name)

результаты в

/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: 

  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: 
  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: The downloaded source packages are in
    ‘/tmp/RtmpTBas6a/downloaded_packages
  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Updating HTML index of packages in '.Library'

  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Making 'packages.html' ...
  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning:  done

  warnings.warn(x, RRuntimeWarning)
rpy2.rinterface.NULL

Хорошо, пока все хорошо, что должен был установить его. Итак, давайте импортируем это:

# Import Discrete goodness-of-fit package which includes KS and CVM tests.
dgof = rpackages.importr('dgof')

Это действительно импортировало это? Посмотрим:

env = r.wherefrom('dgof')

возвращается

/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Error: object 'dgof' not found

  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: In addition: 
  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Warning message:

  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: In (function (x, y, ..., alternative = c("two.sided", "less", "greater"),  :
  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: 

  warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning:  cannot compute correct p-values with ties

  warnings.warn(x, RRuntimeWarning)

  warnings.warn(x, RRuntimeWarning)

Хорошо, это странно, но, может быть, это все равно работает, давайте посмотрим (это точно тот же пример, что и на стороне R, и он должен вернуть D = 0.66667, p-value = 0.07407):

import rpy2.robjects.numpy2ri
rpy2.robjects.numpy2ri.activate()
import numpy as np
a = np.array([1,1,1])
b = np.arange(1,3)
dgof.ks_test(a,b)

возвращается

D = 0.5, p-value = 0.925086

Если это ничего не значит для вас так хорошо, вам нужно знать, что это неправильно. Кажется, что это неправильно, потому что почему-то стандартное ks_test загружается вместо дискретного (того, о котором мы говорим в пункте 2 в приведенном выше списке). Давайте проверим, загрузив стандартную библиотеку и тест KS:

from rpy2.robjects.packages import importr
base     = importr('base')
stats    = importr('stats')
import rpy2.robjects.numpy2ri
rpy2.robjects.numpy2ri.activate()
import numpy as np

a = np.array([1,1,1])
b = np.arange(1,3)
stats.ks_test(a,b)

возвращается

D = 0.5, p-value = 0.925086

Так круто - кто-нибудь знает, почему это может происходить?

ПРИМЕЧАНИЕ: этот вопрос связан с моим другим вопросом, но с большим количеством подробностей о Python.

Теги:
rpy2
kolmogorov-smirnov

1 ответ

0

Это действительно импортировало это? Посмотрим:

env = r.wherefrom('dgof')

возвращается

/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Error: object 'dgof' not found

RRuntimeWarning происходит от самого R, и это то, что и следовало ожидать. Объекта dgof потому что пространства имен пакетов R не являются объектами.

То, что вы хотите, вероятно, wherefrom('ks.test') (см. Https://rpy2.github.io/doc/v2.9.x/html/robjects_rpackages.html#finding-where-an-r-symbol-is -входящий из).

Между ними может происходить много вещей, в зависимости от того, что делает пакет 'dgof' (если вы пришли из Python, R может позволить разработчикам пакетов делать действительно странные вещи).

Вы пробовали полагаться на механизмы диспетчеризации и перегрузки R? После загрузки пакета R dgof, вызовите ks.test без указания пространства имен.

dgof = rpackages.importr('dgof')
import rpy2.robjects
# "generic" function ks.test
ks_test = rpy2.robjects.r('ks.test')
# Use it
ks_test(a, b)
  • 0
    Здравствуй! Я дал этому выстрел, но он все еще не работает, я боюсь.
  • 0
    Ну, так как это использует собственную диспетчеризацию R для ks.test , либо переменные, через которые вы проходите через rpy2, отличаются, либо есть что-то еще с чистой версией R, о которой вы сообщаете, для работы (у меня нет dgof чтобы попробовать на момент). Чтобы оценить первое, попробуйте следующее, чтобы увидеть, как преобразовываются ваши векторы Python: robjects.globalenv['a'] затем robjects.r('print(a)')

Ещё вопросы

Сообщество Overcoder
Наверх
Меню