permserver.go 16 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365
  1. package server
  2. import (
  3. "context"
  4. "errors"
  5. "fmt"
  6. "net"
  7. "time"
  8. "perms-system-server/internal/consts"
  9. authHelper "perms-system-server/internal/logic/auth"
  10. pub "perms-system-server/internal/logic/pub"
  11. "perms-system-server/internal/middleware"
  12. userModel "perms-system-server/internal/model/user"
  13. "perms-system-server/internal/svc"
  14. "perms-system-server/pb"
  15. "github.com/zeromicro/go-zero/core/limit"
  16. "github.com/zeromicro/go-zero/core/logx"
  17. "golang.org/x/crypto/bcrypt"
  18. "google.golang.org/grpc/codes"
  19. "google.golang.org/grpc/peer"
  20. "google.golang.org/grpc/status"
  21. )
  22. // unknownPeerBucket 当无法解析对端 IP 时共享的限流桶 key。
  23. // 生产环境 gRPC-over-TCP 必然有 peer.Addr,正常流量不会落到这里;此常量仅为 in-process/socket
  24. // 等边缘路径兜底,避免 M-7 审计指出的"按 p.Addr.String() 取完整 host:port 导致限流形同虚设"的
  25. // 随端口漂移问题。共享同一个 key 会放大 DoS 面(所有未知 peer 共用一个计数器),但在此类路径
  26. // 不走真实业务流量的前提下收益足够。
  27. const unknownPeerBucket = "unknown"
  28. // extractClientIP 从 gRPC context 中提取对端 IP。显式剥离端口号(M-7):gRPC 的 p.Addr.String()
  29. // 形如 "1.2.3.4:54321",端口每次连接都变,若直接作为限流 key 相当于没限流。
  30. // 解析失败返回 error,由上层按场景决定是 fail-close(RefreshToken 敏感路径)还是降级到 unknown 桶
  31. // (VerifyToken 契约层约束不允许返回 error)。
  32. func extractClientIP(ctx context.Context) (string, error) {
  33. p, ok := peer.FromContext(ctx)
  34. if !ok || p == nil || p.Addr == nil {
  35. return "", errors.New("peer not identifiable")
  36. }
  37. host, _, err := net.SplitHostPort(p.Addr.String())
  38. if err != nil || host == "" {
  39. return "", errors.New("peer address invalid")
  40. }
  41. return host, nil
  42. }
  43. // PermServer 权限管理系统 gRPC 服务实现,供接入产品的服务端调用。
  44. type PermServer struct {
  45. svcCtx *svc.ServiceContext
  46. pb.UnimplementedPermServiceServer
  47. }
  48. func NewPermServer(svcCtx *svc.ServiceContext) *PermServer {
  49. return &PermServer{svcCtx: svcCtx}
  50. }
  51. // SyncPermissions 同步权限声明。产品服务端通过 appKey/appSecret 认证后批量同步权限定义(新增/更新/禁用不在列表中的权限)。
  52. func (s *PermServer) SyncPermissions(ctx context.Context, req *pb.SyncPermissionsReq) (*pb.SyncPermissionsResp, error) {
  53. items := make([]pub.SyncPermItem, len(req.Perms))
  54. for i, p := range req.Perms {
  55. items[i] = pub.SyncPermItem{Code: p.Code, Name: p.Name, Remark: p.Remark}
  56. }
  57. result, err := pub.ExecuteSyncPerms(ctx, s.svcCtx, req.AppKey, req.AppSecret, items)
  58. if err != nil {
  59. if se, ok := err.(*pub.SyncPermsError); ok {
  60. // 审计 M-2:404 是 tx 内 LockByCodeTx 命中 sqlx.ErrNotFound(产品行被并发删除)
  61. // 的语义,先于 400/401 前的前置校验放行后才可能出现。接入方 SDK 对 NotFound 一般
  62. // 配置"按业务未命中处理/不重试",若在这里落到 default 分支被统一成 codes.Internal,
  63. // 接入方会把一次正常的"产品不存在"当作系统故障 page 值班,扭曲重试与告警语义。
  64. switch se.Code {
  65. case 400:
  66. return nil, status.Error(codes.InvalidArgument, se.Message)
  67. case 401:
  68. return nil, status.Error(codes.Unauthenticated, se.Message)
  69. case 403:
  70. return nil, status.Error(codes.PermissionDenied, se.Message)
  71. case 404:
  72. return nil, status.Error(codes.NotFound, se.Message)
  73. case 409:
  74. return nil, status.Error(codes.Aborted, se.Message)
  75. default:
  76. return nil, status.Error(codes.Internal, se.Message)
  77. }
  78. }
  79. return nil, status.Error(codes.Internal, "同步权限失败")
  80. }
  81. return &pb.SyncPermissionsResp{Added: result.Added, Updated: result.Updated, Disabled: result.Disabled}, nil
  82. }
  83. // Login 产品端登录。产品成员通过用户名密码 + productCode 登录,返回 JWT 令牌对及用户权限信息。受 IP 维度限流保护。
  84. func (s *PermServer) Login(ctx context.Context, req *pb.LoginReq) (*pb.LoginResp, error) {
  85. clientIP, ipErr := extractClientIP(ctx)
  86. if ipErr != nil {
  87. // 审计 M-7 的核心修复是"把 host:port 剥成 host,避免端口漂移让限流失效";
  88. // 生产环境 gRPC 必有 peer,这里走不到;in-process/单测等边缘路径回落到共享 unknown 桶,
  89. // 上层仍会继续执行用户名级的 UsernameLoginLimit,不会造成防护真空。
  90. clientIP = unknownPeerBucket
  91. }
  92. if s.svcCtx.GrpcLoginLimiter != nil {
  93. code, _ := s.svcCtx.GrpcLoginLimiter.Take(fmt.Sprintf("grpc:login:%s", clientIP))
  94. if code == limit.OverQuota {
  95. return nil, status.Error(codes.ResourceExhausted, "请求过于频繁,请稍后再试")
  96. }
  97. }
  98. if req.ProductCode == "" {
  99. return nil, status.Error(codes.InvalidArgument, "productCode不能为空")
  100. }
  101. result, err := pub.ValidateProductLogin(ctx, s.svcCtx, req.Username, req.Password, req.ProductCode, clientIP)
  102. if err != nil {
  103. if le, ok := err.(*pub.LoginError); ok {
  104. switch le.Code {
  105. case 400:
  106. return nil, status.Error(codes.InvalidArgument, le.Message)
  107. case 401:
  108. return nil, status.Error(codes.Unauthenticated, le.Message)
  109. case 403:
  110. return nil, status.Error(codes.PermissionDenied, le.Message)
  111. case 429:
  112. return nil, status.Error(codes.ResourceExhausted, le.Message)
  113. }
  114. }
  115. return nil, status.Error(codes.Internal, "登录失败")
  116. }
  117. ud := result.UserDetails
  118. return &pb.LoginResp{
  119. AccessToken: result.AccessToken,
  120. RefreshToken: result.RefreshToken,
  121. Expires: time.Now().Unix() + s.svcCtx.Config.Auth.AccessExpire,
  122. UserId: ud.UserId,
  123. Username: ud.Username,
  124. Nickname: ud.Nickname,
  125. MemberType: ud.MemberType,
  126. Perms: ud.Perms,
  127. }, nil
  128. }
  129. // RefreshToken 刷新令牌。使用有效的 refreshToken 换取新的令牌对,同时原子 CAS 递增 tokenVersion
  130. // 使旧令牌即时失效(单会话轮转)。受 IP 维度限流保护,防止签名爆破和并发刷新被用于会话劫持。
  131. func (s *PermServer) RefreshToken(ctx context.Context, req *pb.RefreshTokenReq) (*pb.RefreshTokenResp, error) {
  132. clientIP, ipErr := extractClientIP(ctx)
  133. if ipErr != nil {
  134. // 和 Login 相同,IP 解析失败走共享 unknown 桶;后续 CAS(IncrementTokenVersionIfMatch)
  135. // 和 per-user TokenOpLimiter 仍然兜底 session 劫持路径。
  136. clientIP = unknownPeerBucket
  137. }
  138. if s.svcCtx.GrpcRefreshLimiter != nil {
  139. code, _ := s.svcCtx.GrpcRefreshLimiter.Take(fmt.Sprintf("grpc:refresh:%s", clientIP))
  140. if code == limit.OverQuota {
  141. return nil, status.Error(codes.ResourceExhausted, "请求过于频繁,请稍后再试")
  142. }
  143. }
  144. claims, err := authHelper.ParseRefreshToken(req.RefreshToken, s.svcCtx.Config.Auth.RefreshSecret)
  145. if err != nil {
  146. return nil, status.Error(codes.Unauthenticated, "refreshToken无效或已过期")
  147. }
  148. productCode := claims.ProductCode
  149. if req.ProductCode != "" && req.ProductCode != productCode {
  150. return nil, status.Error(codes.InvalidArgument, "刷新令牌不允许切换产品")
  151. }
  152. ud, err := s.svcCtx.UserDetailsLoader.Load(ctx, claims.UserId, productCode)
  153. if err != nil {
  154. // 与"用户已删除"区分:基础设施短时不可用走 Unavailable,token 不作废让客户端重试
  155. // (见审计 M-1)。
  156. return nil, status.Error(codes.Unavailable, "服务暂时不可用,请稍后重试")
  157. }
  158. if ud.Username == "" {
  159. return nil, status.Error(codes.Unauthenticated, "用户不存在或已被删除")
  160. }
  161. if ud.Status != consts.StatusEnabled {
  162. return nil, status.Error(codes.PermissionDenied, "账号已被冻结")
  163. }
  164. if productCode != "" && ud.ProductStatus != consts.StatusEnabled {
  165. return nil, status.Error(codes.PermissionDenied, "该产品已被禁用")
  166. }
  167. if productCode != "" && !ud.IsSuperAdmin && ud.MemberType == "" {
  168. return nil, status.Error(codes.PermissionDenied, "您已不是该产品的成员")
  169. }
  170. if claims.TokenVersion != ud.TokenVersion {
  171. return nil, status.Error(codes.Unauthenticated, "登录状态已失效,请重新登录")
  172. }
  173. if s.svcCtx.TokenOpLimiter != nil {
  174. code, _ := s.svcCtx.TokenOpLimiter.Take(fmt.Sprintf("grpc-refresh-u:%d", claims.UserId))
  175. if code == limit.OverQuota {
  176. return nil, status.Error(codes.ResourceExhausted, "刷新操作过于频繁,请稍后再试")
  177. }
  178. }
  179. // 审计 M-3:CAS 推进 tokenVersion 和签新令牌必须全部成功才能响应客户端,否则会出现
  180. // tokenVersion 已+1 但客户端仍拿着旧 refreshToken → 下一次刷新必 401 被强制登出
  181. // 的"非预期登出"事件(会污染会话劫持告警)。改为"先试签 → 再 CAS":
  182. // (a) 拿 claims.TokenVersion+1 预试签发 access/refresh;签名若失败(HMAC 只有 OOM 等
  183. // 极端情况才会失败)直接 500,DB 状态完全不动。
  184. // (b) 两个 token 都成功后再做 IncrementTokenVersionIfMatch 做并发唯一赢家 CAS;CAS 失败走
  185. // 原来的 401/500 分支,客户端拿着的旧 refreshToken 仍然有效。
  186. // (c) CAS 赢家在返回前 Clean 缓存,保证 caller 下一次 Load 读到的是 DB 最新 tokenVersion。
  187. // 注意:由于 CAS 的新 version 一定等于 claims.TokenVersion + 1(见 IncrementTokenVersionIfMatch
  188. // 的 UPDATE 语义),这里直接按 claims.TokenVersion+1 预签即可,CAS 成功返回的 newVersion
  189. // 只用于 assert。
  190. predictedVersion := claims.TokenVersion + 1
  191. accessToken, err := authHelper.GenerateAccessToken(
  192. s.svcCtx.Config.Auth.AccessSecret, s.svcCtx.Config.Auth.AccessExpire,
  193. ud.UserId, ud.Username, ud.ProductCode, ud.MemberType, predictedVersion,
  194. )
  195. if err != nil {
  196. return nil, status.Error(codes.Internal, "生成token失败")
  197. }
  198. newRefreshToken, err := authHelper.GenerateRefreshTokenWithExpiry(
  199. s.svcCtx.Config.Auth.RefreshSecret,
  200. claims.ExpiresAt.Time,
  201. ud.UserId, ud.ProductCode, predictedVersion,
  202. )
  203. if err != nil {
  204. return nil, status.Error(codes.Internal, "生成token失败")
  205. }
  206. newVersion, err := s.svcCtx.SysUserModel.IncrementTokenVersionIfMatch(ctx, claims.UserId, ud.Username, claims.TokenVersion)
  207. if err != nil {
  208. if errors.Is(err, userModel.ErrTokenVersionMismatch) {
  209. return nil, status.Error(codes.Unauthenticated, "登录状态已失效,请重新登录")
  210. }
  211. return nil, status.Error(codes.Internal, "刷新token失败")
  212. }
  213. if newVersion != predictedVersion {
  214. // 防御:CAS 成功时服务端约定 +1,实际不一致说明上游 SQL 实现漂移。告警后直接要求重登,
  215. // 保证客户端不会被发一个 tokenVersion 对不上的 token。
  216. logx.WithContext(ctx).Errorw("refresh token version prediction mismatch",
  217. logx.Field("audit", "refresh_token_version_mismatch"),
  218. logx.Field("userId", claims.UserId),
  219. logx.Field("claimed", claims.TokenVersion),
  220. logx.Field("predicted", predictedVersion),
  221. logx.Field("actual", newVersion),
  222. )
  223. return nil, status.Error(codes.Unauthenticated, "登录状态已失效,请重新登录")
  224. }
  225. s.svcCtx.UserDetailsLoader.Clean(ctx, claims.UserId)
  226. return &pb.RefreshTokenResp{
  227. AccessToken: accessToken,
  228. RefreshToken: newRefreshToken,
  229. Expires: time.Now().Unix() + s.svcCtx.Config.Auth.AccessExpire,
  230. }, nil
  231. }
  232. // VerifyToken 验证令牌。校验 accessToken 的有效性(签名、过期、用户状态、产品状态、成员资格、tokenVersion),
  233. // 有效时返回用户身份和权限信息。受 IP 维度限流保护,防止下游被攻破后把权限中心当作 token oracle 做爆破。
  234. //
  235. // 注意:本方法对外契约是"任何畸形/非法 token 都只返回 Valid=false,不返回 gRPC 错误"(见 fuzz 契约测试),
  236. // 因此 IP 解析失败时不能走 fail-close,改为降级到共享 "unknown" 限流桶——仍然有限速,但不破坏上游产品网关
  237. // 的稳定错误分类;真正过载时用 ResourceExhausted 响应。
  238. func (s *PermServer) VerifyToken(ctx context.Context, req *pb.VerifyTokenReq) (*pb.VerifyTokenResp, error) {
  239. clientIP, ipErr := extractClientIP(ctx)
  240. if ipErr != nil {
  241. clientIP = "unknown"
  242. }
  243. if s.svcCtx.GrpcVerifyLimiter != nil {
  244. code, _ := s.svcCtx.GrpcVerifyLimiter.Take(fmt.Sprintf("grpc:verify:%s", clientIP))
  245. if code == limit.OverQuota {
  246. return nil, status.Error(codes.ResourceExhausted, "请求过于频繁,请稍后再试")
  247. }
  248. }
  249. token, err := middleware.ParseWithHMAC(req.AccessToken, s.svcCtx.Config.Auth.AccessSecret, &middleware.Claims{})
  250. if err != nil || !token.Valid {
  251. logx.WithContext(ctx).Infof("verifyToken fail reason=invalid_token")
  252. return &pb.VerifyTokenResp{Valid: false}, nil
  253. }
  254. claims, ok := token.Claims.(*middleware.Claims)
  255. if !ok || claims.TokenType != consts.TokenTypeAccess {
  256. logx.WithContext(ctx).Infof("verifyToken fail reason=bad_claims")
  257. return &pb.VerifyTokenResp{Valid: false}, nil
  258. }
  259. ud, err := s.svcCtx.UserDetailsLoader.Load(ctx, claims.UserId, claims.ProductCode)
  260. if err != nil {
  261. // VerifyToken 的对外契约是"任何 token 问题只回 Valid=false,不抛 gRPC 错误"。但基础设施
  262. // 故障不属于"token 问题"——同化为 Valid=false 会让下游把合法用户踢出登录(见审计 M-1)。
  263. // 走 Unavailable,由下游按瞬时故障重试而不是据此清 token。
  264. logx.WithContext(ctx).Errorf("verifyToken: load user details failed: %v", err)
  265. return nil, status.Error(codes.Unavailable, "服务暂时不可用,请稍后重试")
  266. }
  267. if ud.Username == "" {
  268. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=user_not_found", claims.UserId)
  269. return &pb.VerifyTokenResp{Valid: false}, nil
  270. }
  271. if ud.Status != consts.StatusEnabled {
  272. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=user_disabled", claims.UserId)
  273. return &pb.VerifyTokenResp{Valid: false}, nil
  274. }
  275. if claims.TokenVersion != ud.TokenVersion {
  276. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=token_version_mismatch", claims.UserId)
  277. return &pb.VerifyTokenResp{Valid: false}, nil
  278. }
  279. if claims.ProductCode != "" && ud.ProductStatus != consts.StatusEnabled {
  280. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=product_disabled product=%s", claims.UserId, claims.ProductCode)
  281. return &pb.VerifyTokenResp{Valid: false}, nil
  282. }
  283. if claims.ProductCode != "" && !ud.IsSuperAdmin && ud.MemberType == "" {
  284. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=not_member product=%s", claims.UserId, claims.ProductCode)
  285. return &pb.VerifyTokenResp{Valid: false}, nil
  286. }
  287. return &pb.VerifyTokenResp{
  288. Valid: true,
  289. UserId: ud.UserId,
  290. Username: ud.Username,
  291. MemberType: ud.MemberType,
  292. Perms: ud.Perms,
  293. ProductCode: claims.ProductCode,
  294. }, nil
  295. }
  296. // GetUserPerms 查询用户权限。产品服务端通过 appKey/appSecret 认证后查询指定用户在该产品下的成员类型和权限列表,用于产品侧的权限网关判定。
  297. func (s *PermServer) GetUserPerms(ctx context.Context, req *pb.GetUserPermsReq) (*pb.GetUserPermsResp, error) {
  298. product, err := s.svcCtx.SysProductModel.FindOneByAppKey(ctx, req.AppKey)
  299. if err != nil {
  300. return nil, status.Error(codes.Unauthenticated, "无效的appKey")
  301. }
  302. if err := bcrypt.CompareHashAndPassword([]byte(product.AppSecret), []byte(req.AppSecret)); err != nil {
  303. return nil, status.Error(codes.Unauthenticated, "appSecret验证失败")
  304. }
  305. if product.Status != consts.StatusEnabled {
  306. return nil, status.Error(codes.PermissionDenied, "产品已被禁用")
  307. }
  308. if product.Code != req.ProductCode {
  309. return nil, status.Error(codes.InvalidArgument, "appKey与productCode不匹配")
  310. }
  311. ud, err := s.svcCtx.UserDetailsLoader.Load(ctx, req.UserId, req.ProductCode)
  312. if err != nil {
  313. return nil, status.Error(codes.Unavailable, "服务暂时不可用,请稍后重试")
  314. }
  315. if ud.Username == "" {
  316. return nil, status.Error(codes.NotFound, "用户不存在")
  317. }
  318. if ud.Status != consts.StatusEnabled {
  319. return nil, status.Error(codes.PermissionDenied, "用户已被冻结")
  320. }
  321. if !ud.IsSuperAdmin && ud.MemberType == "" {
  322. return nil, status.Error(codes.PermissionDenied, "用户不是该产品的有效成员")
  323. }
  324. return &pb.GetUserPermsResp{
  325. MemberType: ud.MemberType,
  326. Perms: ud.Perms,
  327. }, nil
  328. }