Follow-up Q & A

Leveraging R for Real-Time Data Analysis and Reporting in the AI+HI Paradigm

Kai Gu: 请问下这个tool的适用人群包括哪些部门

Hao:适用人群比较广泛,有数据分析,做table,画图等需求的部门都可以,如DM 用来做data query, Programming和Stat用来计算和画图

Longfei: 正如Hao所说 我们这一行是很严格的 这个case 准确率如何?

Hao:当前主要是copilot,人机结合,人工验证。 主要用GPT3.5,简单到中等任务可以,复杂的需要人在draft的code上做进一步修改。GPT4 准确率会更高,但是太慢不能real-time,人机结合体验不好,同时token cost也比较高。随着LLM不断推陈出新,可以期待越来越多的任务会变得容易

Zou, Ivan: 请问以上结果都是在模型中基于prompt input做出来的吗? 是否有用到其他RAG或者fine-tuned?

Hao:现在是基于直接prompt和RAG辅助。之前有用到复杂的COT和GPT4去处理复杂的问题,但是处理时间太长。为了real-time达到copilot的效果,主要是用GPT3.5; 未来会考虑fine-tune,效率可以进一步提高

DaVinci Journey in the Early Phase Oncology Study

请问和teal的融合时,需要把data都按照teal做预处理吗?(teal_data?)

是的,需要的。Teal是基于ADaM,遵守Roche内部的ADS 标准。当我们的ADaM和Roche ADaM 有出入的时候,会有报错。

有时候提示信息也不会很明显,这样导致了的很多时间都花在了debug改数据上。

Optimize decision-making efficiency and speed by performing exploratory analysis through the MedDRAH platform

Qike: 请问这个网站是开放还是仅供内部使用的?

ZY: 目前仅仅是内部使用

wenlu: 请问ongoing 的数据如果遇到data issue,是否会影响展示的数据。

ZY: 要看是什么样的data issue,是否影响了后端的计算。如果程序做了error处理,也会报出来一些错误。通过错误看是改程序还是改数据。对于不影响展示的数据,比如outlier之类的,这个工具也可以用来发现data issue

wenlu: 请问开发这个交互平台用了多长的时间和投入了多少resource

不算前期调研,MDR 板块用了大概半年时间。我做了大部分的后端和前端,一名IT同事做了一部分前端,两个本组的同事帮忙做了两个后端API 的函数。

Keyu Chen: 请问这个平台的Web应用是支持多线程的吗?会存在高并发的问题吗

ZY: 支持多线程, 高并发还要后面去解决。现在只是先把功能做好,能用起来。

Zou, Ivan: 请问在build前端界面时,由于后端是使用的R和python,那么前端不直接用Python Flask或者R shiny构建的理由? 同样对于table和plot的display,有考虑直接使用Python或者R中的库去实现相同效果吗?

ZY: Javascript 做前端会更灵活和方便。互动性也会更好。Plotly 也有Python 版本吧。R 产生的图不支持互动。